doc2vecモデル全体からの単語ベクトルと特定のドキュメントからの単語ベクトル

debugcn 投稿 Dev

JCガルニエ

gensimのDoc2Vecモデルをデフォルトのword2vecトレーニング（dm = 1）でトレーニングしました。model.wv.vectorsのグローバルモデルから単語ベクトルを取得できます。しかし、ドキュメントには、同じ単語（例では「葉」）は、それが表示されるドキュメントのコンテキストに応じて同じベクトルを持たないと書かれています。

だから私は少し混乱しています：model.wv.vectorsでは、例として「葉」という単語は、モデルのトレーニングに使用されるすべてのドキュメントに対して同じベクトルを持ちます（これは、ドキュメントから理解していることと矛盾する可能性があります））？そうでない場合、特定のドキュメントから単語ベクトルを取得する方法は？

ゴジョモ

そのドキュメントは誤解を招く可能性があります。単語トークンに'leaves'は、そのモデルに1つの単語ベクトルしかありません。

そのコメントの作者は、PV-DMモードでのモデルトレーニング中に（）、トレーニング予測が単語ベクトルとそのための「フローティング」ドキュメントベクトルの組み合わせによって影響を受けることを意味したのではないかと推測dm=1しています。テキスト（およびコンテキストウィンドウ内の他の隣接する単語ベクトル）。しかし、それでも、1つの単語には1つのベクトルしかなく、そこでの説明は混乱しています。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-08-15

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

doc2vecモデル全体からの単語ベクトルと特定のドキュメントからの単語ベクトル

doc2vecモデル全体からの単語ベクトルと特定のドキュメントからの単語ベクトル

Gensim Word2Vecモデルでの単語とベクトルの一致

Rの文字列のベクトルからの単語のマッチング

ベクトルからテキスト内の一致する単語を検索します

ベクトルからテキスト内の一致する単語を検索します

word2vecベクトルから単語を取得する方法は？

gensim 0.11.1のDoc2Vecからドキュメントベクトルを取得するにはどうすればよいですか？

Gensim Word2Vecは、事前にトレーニングされたモデルから単語ベクトルのマイナーセットを選択します

word2vec-特定のベクトルで単語を検索します

Doc2vecは、2つのドキュメントベクトルではなく、1つのドキュメントのみのデータを出力します。

PythonのNLP：ベクトル化後にSelectKBestから単語名を取得する

文の感情分析のためにkerasSequntialモデルでdoc2vecからの文ベクトルを使用する方法は？

ドイツ語の単語のspaCyベクトルの不一致のドキュメントと実装？

テキストファイルからベクターc ++への単語の追加

単語ベクトルは、doc2vec DBOWの段落ベクトルとどのように共同トレーニングされますか？

QMLのテキストから特定の単語クリックのクリックイベントをキャッチすることは可能ですか？

doc2vecの元のドキュメントに単語をさかのぼることは可能ですか？

リクエストモジュールを使用して、レベルソコンテキストから単語の翻訳を含むサンプル文を取得することは可能ですか？

文字列ベクトルデータから単語の文字列を抽出する

gsubとmapplyを使用して、異なる長さの単語の別のベクトルから単語のベクトルを削除します

文字列のベクトルから特定の単語を抽出する

greplを使用してベクトルから複数の単語を除外する

greplを使用してベクトルから複数の単語を除外する

Rテキストファイルからintエンコードされた単語のベクトルをインポートします

テンソルフローから gensim への単語ベクトルのインポート

doc2vec: 推論されたドキュメントからドキュメントをプルする

Gensim：単語ベクトルのエンコードの問題

CBOWword2vecの特定の単語のベクトルとは何ですか？

ドキュメントごとの一意の単語/用語から特定の要素にアクセスする

doc2vecモデルを使用して、ドキュメントと比較した1つの単語またはいくつかの単語の類似性を計算するにはどうすればよいですか？