事前にトレーニングされたモデルを使用したgensimでは、wmdistanceは適切に機能していますが、n_similarityは機能していません

ユリC

事前にトレーニングされたモデルでgensimのwmdistance()関数を使用して、2つの文の間の距離を計算しました

今、私はそれらの間の類似性を望み、n_similarity()関数で試しましたが、キーエラーが発生しました

keyerror:単語がvacabularyにありません

これはエラー例のスクリーンショットを示しています エラー例のスクリーンショット

誰かがこれについて考えを持っていますか?

ゴジョモ

単語が語彙に含まれていないというエラーが発生した場合は、その単語がそのモデルに含まれていないことを意味します。

それを検索しようとするとKeyErrorが生成され、そこにない単語ベクトルを取得しようとしていることが通知されます。

トークンをに渡す前に、トークンのリストをフィルタリングしてn_similarity()、有効な単語のみを含める必要があります。

もちろん、それはあなたが単語について意味のある結果を得ることができないことを意味します'selfie'あなたが単語を求めたかのように、それはモデルにとって未知のナンセンスです'asruhfglaiwurfliuawiufsdfsdfs'

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

Related 関連記事

ホットタグ

アーカイブ