単語とそれに対応するベクトル(単語あたり100のサイズ)を含むndarrayがあります。例えば:
Computer 0.11 0.41 ... 0.56
Ball 0.31 0.87 ... 0.32
等々。
それからword2vecモデルを作成したい:
model = load_from_ndarray(arr)
どうすればそれができますか?私が見た
KeyedVectors
しかし、それはファイルだけを取り、配列は取りません
from gensim.models import KeyedVectors
words = myarray[:,0]
vectors = myarray[:,1:]
model = KeyedVectors(vectors.shape[1])
model.add(words, vectors)
必要に応じて保存できます
model.save('mymodel')
後でそれをロードするだけです
model = KeyedVectors.load('mymodel')
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加