Doc2Vecモデルのトレーニングを続ける

zepp.lee

Gensimの公式チュートリアルでは、(ロードされた)モデルのトレーニングを継続できると明示的に述べています。ドキュメントによると、word2vecフォーマットからロードされたモデルのトレーニングを継続することはできないことを認識しています。ただし、モデルを最初から生成してからtrainメソッドを呼び出そうとしても、にLabeledSentence提供されたインスタンスの新しく作成されたラベルにアクセスすることはできませんtrain

>>> sentences = [LabeledSentence(['first', 'sentence'], ['SENT_0']), LabeledSentence(['second', 'sentence'], ['SENT_1'])]
>>> model = Doc2Vec(sentences, min_count=1)
>>> print(model.vocab.keys())
dict_keys(['SENT_0', 'SENT_1', 'sentence', 'first', 'second'])
>>> sentence = LabeledSentence(['third', 'sentence'], ['SENT_2'])
>>> model.train([sentence])
>>> print(model.vocab.keys())

# At this point I would expect the key 'SENT_2' to be present in the vocabulary, but it isn't
dict_keys(['SENT_0', 'SENT_1', 'sentence', 'first', 'second'])

GensimでDoc2Vecモデルのトレーニングを新しい文で継続することは可能ですか?もしそうなら、これはどのように達成できますか?

バットガール

私の理解では、これは新しいレーベルでは不可能です。新しいデータに古いデータと同じラベルが付いている場合にのみ、トレーニングを続行できます。その結果、すでに学習した語彙の重みをトレーニングまたは再調整していますが、新しい語彙を学習することはできません。

トレーニング中に新しいラベル/単語/文を追加するための同様の質問がありますhttps//groups.google.com/forum/#!searchin / word2vec-toolkit / online $ 20word2vec / word2vec-toolkit / L9zoczopPUQ / _Zmy57TzxUQJ

また、このディスカッションに注目することをお勧めします:https//groups.google.com/forum/#!topic / gensim / UZDkfKwe9VI

更新:すでにトレーニングされたモデルに新しい単語を追加したい場合は、ここでオンラインのword2vecを見てください:http://rutumulkar.com/blog/2015/word2vec/

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

ケラス:モデルを保存してトレーニングを続ける方法は?

分類Dev

tensorflowモデルを読み込んでトレーニングを続ける方法

分類Dev

FastTextモデルのトレーニングを続ける

分類Dev

doc2Vecモデルをトレーニングするには、実際にどのくらいのデータが必要ですか?

分類Dev

Doc2Vecモデルのトレーニング後の精度が低い

分類Dev

gensim doc2vecは、事前にトレーニングされたモデルからより多くのドキュメントをトレーニングします

分類Dev

Gensim doc2vecモデルをプレーンテキスト(.txt)として保存する方法はありますか?

分類Dev

gensim:Googleの事前トレーニング済みword2vecモデルをロードすると、「Doc2Vec」オブジェクトに属性「intersect_word2vec_format」がありません

分類Dev

Gensim Doc2vecモデル:事前にトレーニングされたdoc2vecモデルを使用して取得されたコーパスの類似性を計算する方法は?

分類Dev

単語ベクトルは、doc2vec DBOWの段落ベクトルとどのように共同トレーニングされますか?

分類Dev

wikicorpusでトレーニングされたdoc2vecモデルからの新しい文

分類Dev

gensimでDoc2vecをトレーニングするためにマルチコアCPUを効率的に使用することはできません

分類Dev

新しい語彙でword2vecモデルを段階的にトレーニングする方法

分類Dev

Doc2vecモデルの精度を測定する方法は?

分類Dev

Doc2VecモデルのDBSCANクラスタリングのプロット

分類Dev

gensimの事前トレーニング済みモデルをdoc2vecモデルに使用できますか?

分類Dev

doc2vec埋め込みをトレーニングするための学習曲線を作成する

分類Dev

トレーニング中にmin_countが1に設定されている場合でも、Doc2VecモデルのKeyError

分類Dev

事前にトレーニングされたモデルをgensimにロードし、それを使用してdoc2vecをトレーニングするにはどうすればよいですか?

分類Dev

doc2vec-Pythonでのdoc2vecトレーニングとinfer_vector()の入力形式

分類Dev

Gensim: 事前トレーニング済みの doc2vec モデルのロード中にエラーが発生しましたか?

分類Dev

2 つの GPU で 2 つのモデルをトレーニングする

分類Dev

Pythonエラー: "'numpy.ndarray'オブジェクトに属性がありません 'words'" doc2vecのトレーニング時

分類Dev

Doc2Vecモデルは、ドキュメントタグをシンボルに分割します

分類Dev

Doc2vecモデルのセマンティックおよび構文パフォーマンス

分類Dev

doc2vecの階層トレーニング:同じドキュメントの文に同じラベルを割り当てるとどのように機能しますか?

分類Dev

doc2vecモデルで事前トレーニングされたword2vecベクトルを使用する方法は?

分類Dev

Gensimを使用してWord2vecモデルをトレーニングする

分類Dev

doc2vec段落表現をトレーニング後のクラスタグにマッピングする

Related 関連記事

  1. 1

    ケラス:モデルを保存してトレーニングを続ける方法は?

  2. 2

    tensorflowモデルを読み込んでトレーニングを続ける方法

  3. 3

    FastTextモデルのトレーニングを続ける

  4. 4

    doc2Vecモデルをトレーニングするには、実際にどのくらいのデータが必要ですか?

  5. 5

    Doc2Vecモデルのトレーニング後の精度が低い

  6. 6

    gensim doc2vecは、事前にトレーニングされたモデルからより多くのドキュメントをトレーニングします

  7. 7

    Gensim doc2vecモデルをプレーンテキスト(.txt)として保存する方法はありますか?

  8. 8

    gensim:Googleの事前トレーニング済みword2vecモデルをロードすると、「Doc2Vec」オブジェクトに属性「intersect_word2vec_format」がありません

  9. 9

    Gensim Doc2vecモデル:事前にトレーニングされたdoc2vecモデルを使用して取得されたコーパスの類似性を計算する方法は?

  10. 10

    単語ベクトルは、doc2vec DBOWの段落ベクトルとどのように共同トレーニングされますか?

  11. 11

    wikicorpusでトレーニングされたdoc2vecモデルからの新しい文

  12. 12

    gensimでDoc2vecをトレーニングするためにマルチコアCPUを効率的に使用することはできません

  13. 13

    新しい語彙でword2vecモデルを段階的にトレーニングする方法

  14. 14

    Doc2vecモデルの精度を測定する方法は?

  15. 15

    Doc2VecモデルのDBSCANクラスタリングのプロット

  16. 16

    gensimの事前トレーニング済みモデルをdoc2vecモデルに使用できますか?

  17. 17

    doc2vec埋め込みをトレーニングするための学習曲線を作成する

  18. 18

    トレーニング中にmin_countが1に設定されている場合でも、Doc2VecモデルのKeyError

  19. 19

    事前にトレーニングされたモデルをgensimにロードし、それを使用してdoc2vecをトレーニングするにはどうすればよいですか?

  20. 20

    doc2vec-Pythonでのdoc2vecトレーニングとinfer_vector()の入力形式

  21. 21

    Gensim: 事前トレーニング済みの doc2vec モデルのロード中にエラーが発生しましたか?

  22. 22

    2 つの GPU で 2 つのモデルをトレーニングする

  23. 23

    Pythonエラー: "'numpy.ndarray'オブジェクトに属性がありません 'words'" doc2vecのトレーニング時

  24. 24

    Doc2Vecモデルは、ドキュメントタグをシンボルに分割します

  25. 25

    Doc2vecモデルのセマンティックおよび構文パフォーマンス

  26. 26

    doc2vecの階層トレーニング:同じドキュメントの文に同じラベルを割り当てるとどのように機能しますか?

  27. 27

    doc2vecモデルで事前トレーニングされたword2vecベクトルを使用する方法は?

  28. 28

    Gensimを使用してWord2vecモデルをトレーニングする

  29. 29

    doc2vec段落表現をトレーニング後のクラスタグにマッピングする

ホットタグ

アーカイブ