Doc2vecモデルのセマンティックおよび構文パフォーマンス

シェア

doc2vecモデルのセマンティックおよび構文パフォーマンスを確認しようとしていますが、models.deprecated.doc2vecdoc2vec_model.accuracy(questions-words)から機能していないようです。paragraph2vecを使用したディープラーニングでは、gensimパッケージのバージョン3.3.0以降非推奨になっているとのことです。このエラーメッセージを表示します

AttributeError: 'Doc2Vec' object has no attribute 'accuracy'

それはword2vecモデルでうまく機能しますが、それ以外にそれを行うことができる方法はありますdoc2vec_model.accuracy(questions-words)か?またはそれは不可能ですか?

ゴジョモ

いくつかの注意:

その「accuracy()」テストは、類推問題に関する単語ベクトルのテストにすぎません。実行が簡単で、多くの論文で使用されていますが、単語ベクトルのセットが他の単語ベクトルよりも優れているかどうかについての最終的な権限ではありません。特定の目的。(プロジェクト固有のスコアリング方法を使用した場合、プロジェクト固有の目標で最高のスコアを獲得する単語ベクトルが、それらの類推で最高のスコアを獲得しないことがあります。特に、単語ベクトルが分類や情報に使用されている場合はそうです。検索タスク。)

さらに、Doc2Vecdm=0gensimの)一般的で高速なPV-DBOWモードは、別の設定(dbow_words=1を追加しない限り、単語ベクトルをまったくトレーニングしませんそのような訓練されていない単語ベクトルはランダムな場所にあり、類推の正確さでひどく得点します。

ただし、PV-DM(dm=1)モードを使用するかdbow_words=1PV-DBOWに追加するDoc2Vecと、から単語ベクトルが取得されるため、類推テストを実行することをお勧めします。幸いなことに、類推評価オプションは保持KeyedVectorsされており、Doc2Vec wvプロパティに保持されているオブジェクトでも拡張されています。accuracy()そこで古いメソッドを呼び出すことができます

https://radimrehurek.com/gensim/models/keyedvectors.html#gensim.models.keyedvectors.Word2VecKeyedVectors.accuracy

しかし、わずかに異なるスコアもありevaluate_word_pairs()ます:

https://radimrehurek.com/gensim/models/keyedvectors.html#gensim.models.keyedvectors.WordEmbeddingsKeyedVectors.evaluate_word_pairs

(そして、4.0.0リリースでは、[evaluate_word_analogies()][1]`accuracy()を置き換えるがあります。)

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

フラットテーブルのRedshiftパフォーマンスとディメンションおよびファクト

分類Dev

マシンのCPU、メモリ、ディスク、およびネットワークI / Oパフォーマンスをベンチマークするために、どのJavaユーティリティが存在しますか?

分類Dev

パンダ:データフレームの連結、列データのフォワードフィルおよびマルチインデックス

分類Dev

パンダ:データフレームの連結、列データのフォワードフィルおよびマルチインデックス

分類Dev

alphaおよびmin_alphaのdoc2vecのデフォルト値

分類Dev

Javaはセマンティクスとパフォーマンスを比較および交換します

分類Dev

lstm予測モデルにおけるエポック、バッチサイズ、精度、およびパフォーマンスの向上を理解する

分類Dev

チェックボックス、PHPおよびMySQLのパフォーマンスとメンテナンス

分類Dev

今日のモバイルおよびデスクトップブラウザでの「SVGTiny1.2」のパフォーマンス上の利点は?

分類Dev

クラス構文ツリーからクラスセマンティックモデルを取得するにはどうすればよいですか?

分類Dev

パフォーマンスのための構造モデル

分類Dev

Wordpress-デフォルトおよび投稿名のURLパーマリンク

分類Dev

cおよびc ++ 11でのシステムクロックのパフォーマンス

分類Dev

doc2vecで良好なパフォーマンスを実現するために必要な最小データセットサイズはどれくらいですか?

分類Dev

Doc2VecモデルのDBSCANクラスタリングのプロット

分類Dev

GoおよびC ++でのベクトルパフォーマンス

分類Dev

ビッグデータでのD3パフォーマンス(およびフィードバックが必要)

分類Dev

パフォーマンスとメモリ使用量のためのQt5およびC ++ 17コンテナのベンチマーク

分類Dev

反応ネイティブおよびクロームデバッガーでパフォーマンスを重視する機能を見つける

分類Dev

Windows(ファイルエクスプローラー、ディスク管理およびディスクパーツ)とMiniToolおよびsdcard.orgのフォーマッターがメモリカードをフォーマットできませんか?カードを処分する必要がありますか?

分類Dev

$ interpolateとng-repeatおよび1回限りのバインディングのパフォーマンス

分類Dev

処理中のインテルパフォーマンスカウンターを構成およびサンプリングする方法

分類Dev

デュアルモニターとグラフィックカードのパフォーマンス

分類Dev

wikicorpusでトレーニングされたdoc2vecモデルからの新しい文

分類Dev

Tidymodelパッケージ:Rの一般線形モデル(glm)および決定木(バッグツリー、ブースティングツリー、およびランダムフォレスト)モデル

分類Dev

MySQLテーブル-パフォーマンス、インデックスの数

分類Dev

HashSetおよびTreeSetパフォーマンステスト

分類Dev

Doc2VecおよびPySpark:DeepDist上のGensim Doc2vec

分類Dev

Angular 2マテリアルトランスクルージョン、セレクター、および属性ディレクティブ

Related 関連記事

  1. 1

    フラットテーブルのRedshiftパフォーマンスとディメンションおよびファクト

  2. 2

    マシンのCPU、メモリ、ディスク、およびネットワークI / Oパフォーマンスをベンチマークするために、どのJavaユーティリティが存在しますか?

  3. 3

    パンダ:データフレームの連結、列データのフォワードフィルおよびマルチインデックス

  4. 4

    パンダ:データフレームの連結、列データのフォワードフィルおよびマルチインデックス

  5. 5

    alphaおよびmin_alphaのdoc2vecのデフォルト値

  6. 6

    Javaはセマンティクスとパフォーマンスを比較および交換します

  7. 7

    lstm予測モデルにおけるエポック、バッチサイズ、精度、およびパフォーマンスの向上を理解する

  8. 8

    チェックボックス、PHPおよびMySQLのパフォーマンスとメンテナンス

  9. 9

    今日のモバイルおよびデスクトップブラウザでの「SVGTiny1.2」のパフォーマンス上の利点は?

  10. 10

    クラス構文ツリーからクラスセマンティックモデルを取得するにはどうすればよいですか?

  11. 11

    パフォーマンスのための構造モデル

  12. 12

    Wordpress-デフォルトおよび投稿名のURLパーマリンク

  13. 13

    cおよびc ++ 11でのシステムクロックのパフォーマンス

  14. 14

    doc2vecで良好なパフォーマンスを実現するために必要な最小データセットサイズはどれくらいですか?

  15. 15

    Doc2VecモデルのDBSCANクラスタリングのプロット

  16. 16

    GoおよびC ++でのベクトルパフォーマンス

  17. 17

    ビッグデータでのD3パフォーマンス(およびフィードバックが必要)

  18. 18

    パフォーマンスとメモリ使用量のためのQt5およびC ++ 17コンテナのベンチマーク

  19. 19

    反応ネイティブおよびクロームデバッガーでパフォーマンスを重視する機能を見つける

  20. 20

    Windows(ファイルエクスプローラー、ディスク管理およびディスクパーツ)とMiniToolおよびsdcard.orgのフォーマッターがメモリカードをフォーマットできませんか?カードを処分する必要がありますか?

  21. 21

    $ interpolateとng-repeatおよび1回限りのバインディングのパフォーマンス

  22. 22

    処理中のインテルパフォーマンスカウンターを構成およびサンプリングする方法

  23. 23

    デュアルモニターとグラフィックカードのパフォーマンス

  24. 24

    wikicorpusでトレーニングされたdoc2vecモデルからの新しい文

  25. 25

    Tidymodelパッケージ:Rの一般線形モデル(glm)および決定木(バッグツリー、ブースティングツリー、およびランダムフォレスト)モデル

  26. 26

    MySQLテーブル-パフォーマンス、インデックスの数

  27. 27

    HashSetおよびTreeSetパフォーマンステスト

  28. 28

    Doc2VecおよびPySpark:DeepDist上のGensim Doc2vec

  29. 29

    Angular 2マテリアルトランスクルージョン、セレクター、および属性ディレクティブ

ホットタグ

アーカイブ