gensim 0.11.1のDoc2Vecからドキュメントベクトルを取得するにはどうすればよいですか?

silent_dev

gensim 0.11.1バージョンのDoc2Vecから、表示されていないドキュメントと表示されているドキュメントのドキュメントベクトルを取得する方法はありますか?

  • たとえば、モデルを10万でトレーニングしたとします。これらの1000のドキュメントのドキュメントベクトルを取得できますか?


  • 同じ語彙から構成された目に見えないドキュメントのドキュメントベクトルを取得する方法はありますか?

Munichong

最初の箇条書きについては、gensim0.11.1で実行できます。

from gensim.models import Doc2Vec
from gensim.models.doc2vec import LabeledSentence

documents = []
documents.append( LabeledSentence(words=[u'some', u'words', u'here'], labels=[u'SENT_1']) )
documents.append( LabeledSentence(words=[u'some', u'people', u'words', u'like'], labels=[u'SENT_2']) )
documents.append( LabeledSentence(words=[u'people', u'like', u'words'], labels=[u'SENT_3']) )


model = Doc2Vec(size=10, window=8, min_count=0, workers=4)
model.build_vocab(documents)
model.train(documents)

print(model[u'SENT_3'])

ここで、SENT_3は既知の文です。

2番目の箇条書きについては、gensim0.11.1では実行できません。0.12.4に更新する必要があります。この最新バージョンには、見えないドキュメントのベクトルを生成できるinfer_vector関数があります。

documents = []
documents.append( LabeledSentence([u'some', u'words', u'here'], [u'SENT_1']) )
documents.append( LabeledSentence([u'some', u'people', u'words', u'like'], [u'SENT_2']) )
documents.append( LabeledSentence([u'people', u'like', u'words'], [u'SENT_3']) )


model = Doc2Vec(size=10, window=8, min_count=0, workers=4)
model.build_vocab(documents)
model.train(documents)

print(model.docvecs[u'SENT_3']) # generate a vector for a known sentence
print(model.infer_vector([u'people', u'like', u'words'])) # generate a vector for an unseen sentence

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

Gensim Word2VecがCコンパイラを使用しているかどうかを確認するにはどうすればよいですか?

分類Dev

Gensim doc2vecがAttributeErrorを与えるのはなぜですか: 'list'オブジェクトに属性 'words'がありませんか?

分類Dev

Gensim doc2vecがAttributeErrorを与えるのはなぜですか: 'list'オブジェクトに属性 'words'がありませんか?

分類Dev

gensim word2vecの出力埋め込み(出力ベクトル)にアクセスするにはどうすればよいですか?

分類Dev

gensim LDAを使用してドキュメントの完全なトピック配布を取得するにはどうすればよいですか?

分類Dev

AttributeErrorを取得せずにGensimでWord2vecをロードするにはどうすればよいですか?

分類Dev

gensimのLDAを使用してクエリからテキストを取得するにはどうすればよいですか?

分類Dev

Gensim doc2vecmost_similarは完全なドキュメントを取得するのと同等です

分類Dev

gensim word2vecから行列WIとWOを抽出するにはどうすればよいですか?

分類Dev

Python / Gensim-syn0とsyn0normの意味は何ですか?

分類Dev

gensim doc2vecは、事前にトレーニングされたモデルからより多くのドキュメントをトレーニングします

分類Dev

Gensim doc2vecモデルをプレーンテキスト(.txt)として保存する方法はありますか?

分類Dev

Gensim Doc2vecモデル:事前にトレーニングされたdoc2vecモデルを使用して取得されたコーパスの類似性を計算する方法は?

分類Dev

Python Gensimの2つのドキュメント間のトピックの類似性をトピックの分布から比較するにはどうすればよいですか?

分類Dev

文字列の2つのベクトルから1と0の行列を作成するにはどうすればよいですか?

分類Dev

gensimで特定のトピックのドキュメントベクトルを取得する方法

分類Dev

Gensimでドキュメントに関するトピックを印刷するにはどうすればよいですか?

分類Dev

Word2vec gensimに単語とベクターを手動で追加するにはどうすればよいですか?

分類Dev

gensimで中国語のfasttextモデルをロードするにはどうすればよいですか?

分類Dev

Gensim Doc2vecオブジェクトが空のdoctagを返すのはなぜですか?

分類Dev

gensimの事前トレーニング済みモデルをdoc2vecモデルに使用できますか?

分類Dev

Y軸で常に0ニュートラルを取得するにはどうすればよいですか?

分類Dev

事前にトレーニングされたモデルをgensimにロードし、それを使用してdoc2vecをトレーニングするにはどうすればよいですか?

分類Dev

gensim word2vecから語彙の単語数を取得するにはどうすればよいですか?

分類Dev

numpy.ndarrayでキーと値のペアを取得するにはどうすればよいですか?(Gensim Word2vec)

分類Dev

as.numericを使用して、乱数のベクトルを0,1,2のベクトルに変換するにはどうすればよいですか?

分類Dev

0を維持しながら、ゼロが+1の数値をインクリメントするにはどうすればよいですか?

分類Dev

gensim word2vecまたはdoc2vecを使用してvocaburayを2回ビルドできますか?

分類Dev

gensim Doc2Vec:txtファイルからTaggedDocumentsへの取得

Related 関連記事

  1. 1

    Gensim Word2VecがCコンパイラを使用しているかどうかを確認するにはどうすればよいですか?

  2. 2

    Gensim doc2vecがAttributeErrorを与えるのはなぜですか: 'list'オブジェクトに属性 'words'がありませんか?

  3. 3

    Gensim doc2vecがAttributeErrorを与えるのはなぜですか: 'list'オブジェクトに属性 'words'がありませんか?

  4. 4

    gensim word2vecの出力埋め込み(出力ベクトル)にアクセスするにはどうすればよいですか?

  5. 5

    gensim LDAを使用してドキュメントの完全なトピック配布を取得するにはどうすればよいですか?

  6. 6

    AttributeErrorを取得せずにGensimでWord2vecをロードするにはどうすればよいですか?

  7. 7

    gensimのLDAを使用してクエリからテキストを取得するにはどうすればよいですか?

  8. 8

    Gensim doc2vecmost_similarは完全なドキュメントを取得するのと同等です

  9. 9

    gensim word2vecから行列WIとWOを抽出するにはどうすればよいですか?

  10. 10

    Python / Gensim-syn0とsyn0normの意味は何ですか?

  11. 11

    gensim doc2vecは、事前にトレーニングされたモデルからより多くのドキュメントをトレーニングします

  12. 12

    Gensim doc2vecモデルをプレーンテキスト(.txt)として保存する方法はありますか?

  13. 13

    Gensim Doc2vecモデル:事前にトレーニングされたdoc2vecモデルを使用して取得されたコーパスの類似性を計算する方法は?

  14. 14

    Python Gensimの2つのドキュメント間のトピックの類似性をトピックの分布から比較するにはどうすればよいですか?

  15. 15

    文字列の2つのベクトルから1と0の行列を作成するにはどうすればよいですか?

  16. 16

    gensimで特定のトピックのドキュメントベクトルを取得する方法

  17. 17

    Gensimでドキュメントに関するトピックを印刷するにはどうすればよいですか?

  18. 18

    Word2vec gensimに単語とベクターを手動で追加するにはどうすればよいですか?

  19. 19

    gensimで中国語のfasttextモデルをロードするにはどうすればよいですか?

  20. 20

    Gensim Doc2vecオブジェクトが空のdoctagを返すのはなぜですか?

  21. 21

    gensimの事前トレーニング済みモデルをdoc2vecモデルに使用できますか?

  22. 22

    Y軸で常に0ニュートラルを取得するにはどうすればよいですか?

  23. 23

    事前にトレーニングされたモデルをgensimにロードし、それを使用してdoc2vecをトレーニングするにはどうすればよいですか?

  24. 24

    gensim word2vecから語彙の単語数を取得するにはどうすればよいですか?

  25. 25

    numpy.ndarrayでキーと値のペアを取得するにはどうすればよいですか?(Gensim Word2vec)

  26. 26

    as.numericを使用して、乱数のベクトルを0,1,2のベクトルに変換するにはどうすればよいですか?

  27. 27

    0を維持しながら、ゼロが+1の数値をインクリメントするにはどうすればよいですか?

  28. 28

    gensim word2vecまたはdoc2vecを使用してvocaburayを2回ビルドできますか?

  29. 29

    gensim Doc2Vec:txtファイルからTaggedDocumentsへの取得

ホットタグ

アーカイブ