doc2vecモデルのセマンティックおよび構文パフォーマンスを確認しようとしていますが、models.deprecated.doc2vecdoc2vec_model.accuracy(questions-words)
から機能していないようです。paragraph2vecを使用したディープラーニングでは、gensimパッケージのバージョン3.3.0以降非推奨になっているとのことです。このエラーメッセージを表示します
AttributeError: 'Doc2Vec' object has no attribute 'accuracy'
それはword2vecモデルでうまく機能しますが、それ以外にそれを行うことができる方法はありますdoc2vec_model.accuracy(questions-words)
か?またはそれは不可能ですか?
いくつかの注意:
その「accuracy()」テストは、類推問題に関する単語ベクトルのテストにすぎません。実行が簡単で、多くの論文で使用されていますが、単語ベクトルのセットが他の単語ベクトルよりも優れているかどうかについての最終的な権限ではありません。特定の目的。(プロジェクト固有のスコアリング方法を使用した場合、プロジェクト固有の目標で最高のスコアを獲得する単語ベクトルが、それらの類推で最高のスコアを獲得しないことがあります。特に、単語ベクトルが分類や情報に使用されている場合はそうです。検索タスク。)
さらに、Doc2Vec
(dm=0
gensimの)一般的で高速なPV-DBOWモードは、別の設定(dbow_words=1
)を追加しない限り、単語ベクトルをまったくトレーニングしません。そのような訓練されていない単語ベクトルはランダムな場所にあり、類推の正確さでひどく得点します。
ただし、PV-DM(dm=1
)モードを使用するか、dbow_words=1
PV-DBOWに追加するDoc2Vec
と、から単語ベクトルが取得されるため、類推テストを実行することをお勧めします。幸いなことに、類推評価オプションは保持KeyedVectors
されており、Doc2Vec
wv
プロパティに保持されているオブジェクトでも拡張されています。accuracy()
そこで古いメソッドを呼び出すことができます。
しかし、わずかに異なるスコアもありevaluate_word_pairs()
ます:
(そして、4.0.0リリースでは、[evaluate_word_analogies()][1]
`accuracy()を置き換えるがあります。)
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加