新しい語彙でword2vecモデルを段階的にトレーニングする方法

シルイ・リー

40Gを超えるデータセットを取得しました。メモリが限られているため、トークナイザーのプログラムが強制終了されたため、データセットを分割しようとしています。word2vecモデルを段階的にトレーニングするにはどうすればよいですか。つまり、個別のデータセットを使用して1つのword2vecモデルをトレーニングするにはどうすればよいですか。

私の現在のword2vecコードは次のとおりです。

model = gensim.models.Word2Vec(documents, size=150, window=10, min_count=1, workers=10)
model.train(documents,total_examples=len(documents),epochs=epochs)
model.save("./word2vec150d/word2vec_{}.model".format(epochs))

どんな助けでもいただければ幸いです!

シルイ・リー

私は解決策を見つけました:を使用してくださいPathLineSentencesとても速いです。word2vecモデルを段階的にトレーニングしても、新しい語彙を学習することはできませんが、学習することはPathLineSentencesできます。

from gensim.models.word2vec import PathLineSentences

model = Word2Vec(PathLineSentences(input_dir), size=100, window=5, min_count=5, workers=multiprocessing.cpu_count() * 2, iter=20,sg=1)

単一ファイルの場合は、を使用しますLineSentences

from gensim.models.word2vec import LineSentence

model = Word2Vec(LineSentence(file), size=100, window=5, min_count=5, workers=multiprocessing.cpu_count() * 2, iter=20,sg=1)
...

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

TensorFlowで事前トレーニング済みの単語埋め込み(word2vecまたはGlove)を使用する

分類Dev

非常に大きなデータセットでWord2vecをトレーニングする方法は?

分類Dev

word2vecトレーニング済みモデルにキーが存在するかどうかを確認する方法

分類Dev

Word2Vecで事前トレーニング済みモデルをマージしますか?

分類Dev

ワトソン自然言語分類器を段階的にトレーニングする方法は?

分類Dev

事前にトレーニングされたWord2vecモデルファイルをロードして再利用するにはどうすればよいですか?

分類Dev

Word2Vecモデルから単語頻度を取得する方法

分類Dev

ウィキペディアで事前トレーニングされたWord2Vecモデルを使用する

分類Dev

pyspark word2vecモデルから単語リストを取得するにはどうすればよいですか?

分類Dev

事前にトレーニングされた単語ベクトルを使用してgensimword2vecモデルを作成するにはどうすればよいですか?

分類Dev

word2vecで各トレーニング反復後にベクトルを取得するにはどうすればよいですか?

分類Dev

Gensim Word2Vecは、事前にトレーニングされたモデルから単語ベクトルのマイナーセットを選択します

分類Dev

あなた自身の語彙でword2vecを訓練する方法

分類Dev

R H2Oグリッド検索:新しいデータでトップモデルをトレーニングする方法は?

分類Dev

gensim:Googleの事前トレーニング済みword2vecモデルをロードすると、「Doc2Vec」オブジェクトに属性「intersect_word2vec_format」がありません

分類Dev

word2vecの語彙にない単語を最適に処理する方法

分類Dev

sklearnモデル(SVMなど)を段階的にトレーニングすることは可能ですか?

分類Dev

訓練されたword2vecモデルの語彙から欠落している単語

分類Dev

Spacyで新しいモデルをトレーニングする

分類Dev

wikicorpusでトレーニングされたdoc2vecモデルからの新しい文

分類Dev

自己学習したword2vecモデルで単語を削除する方法

分類Dev

事前にトレーニングされたグローブモデルをgensimload_word2vec_formatでロードする方法は?

分類Dev

私がword2vecモデルをトレーニングするために使用するすべての単語は、model.vocabに含まれている必要がありますね。

分類Dev

トレーニング済みのGloVe / word2vecモデルを使用して、記事からキーワードを抽出するにはどうすればよいですか?

分類Dev

Kerasモデルを段階的にトレーニングできますか?

分類Dev

word2vecモデルを更新する際に、古いコーパスと新しいコーパスを混在させる必要がありますか?

分類Dev

別の言語でトレーニングされたWord2vecモデルの精度を測定する方法は?

分類Dev

doc2vecモデルで事前トレーニングされたword2vecベクトルを使用する方法は?

分類Dev

Gensimを使用してWord2vecモデルをトレーニングする

Related 関連記事

  1. 1

    TensorFlowで事前トレーニング済みの単語埋め込み(word2vecまたはGlove)を使用する

  2. 2

    非常に大きなデータセットでWord2vecをトレーニングする方法は?

  3. 3

    word2vecトレーニング済みモデルにキーが存在するかどうかを確認する方法

  4. 4

    Word2Vecで事前トレーニング済みモデルをマージしますか?

  5. 5

    ワトソン自然言語分類器を段階的にトレーニングする方法は?

  6. 6

    事前にトレーニングされたWord2vecモデルファイルをロードして再利用するにはどうすればよいですか?

  7. 7

    Word2Vecモデルから単語頻度を取得する方法

  8. 8

    ウィキペディアで事前トレーニングされたWord2Vecモデルを使用する

  9. 9

    pyspark word2vecモデルから単語リストを取得するにはどうすればよいですか?

  10. 10

    事前にトレーニングされた単語ベクトルを使用してgensimword2vecモデルを作成するにはどうすればよいですか?

  11. 11

    word2vecで各トレーニング反復後にベクトルを取得するにはどうすればよいですか?

  12. 12

    Gensim Word2Vecは、事前にトレーニングされたモデルから単語ベクトルのマイナーセットを選択します

  13. 13

    あなた自身の語彙でword2vecを訓練する方法

  14. 14

    R H2Oグリッド検索:新しいデータでトップモデルをトレーニングする方法は?

  15. 15

    gensim:Googleの事前トレーニング済みword2vecモデルをロードすると、「Doc2Vec」オブジェクトに属性「intersect_word2vec_format」がありません

  16. 16

    word2vecの語彙にない単語を最適に処理する方法

  17. 17

    sklearnモデル(SVMなど)を段階的にトレーニングすることは可能ですか?

  18. 18

    訓練されたword2vecモデルの語彙から欠落している単語

  19. 19

    Spacyで新しいモデルをトレーニングする

  20. 20

    wikicorpusでトレーニングされたdoc2vecモデルからの新しい文

  21. 21

    自己学習したword2vecモデルで単語を削除する方法

  22. 22

    事前にトレーニングされたグローブモデルをgensimload_word2vec_formatでロードする方法は?

  23. 23

    私がword2vecモデルをトレーニングするために使用するすべての単語は、model.vocabに含まれている必要がありますね。

  24. 24

    トレーニング済みのGloVe / word2vecモデルを使用して、記事からキーワードを抽出するにはどうすればよいですか?

  25. 25

    Kerasモデルを段階的にトレーニングできますか?

  26. 26

    word2vecモデルを更新する際に、古いコーパスと新しいコーパスを混在させる必要がありますか?

  27. 27

    別の言語でトレーニングされたWord2vecモデルの精度を測定する方法は?

  28. 28

    doc2vecモデルで事前トレーニングされたword2vecベクトルを使用する方法は?

  29. 29

    Gensimを使用してWord2vecモデルをトレーニングする

ホットタグ

アーカイブ