異なる長さの特徴ベクトルの類似度を見つけます

debugcn 投稿 Dev

シャニ

Javaでは、長さが異なる2つのベクトル間の類似度をどのように見つけることができますか。私たちが持っていると考えてください

V1 = [1, 0, 0, 1, 1]
V1 = [1, 0, 1, 0, 1, 0, 1, 0]

Jaccard係数またはSørensen–Dice係数以外の類似度を探しています

gdiazc

誰かがすでにコメントしているように、可能な代替案は、編集距離とも呼ばれるレーベンシュタイン距離です。

レーベンシュタイン距離は、文字列のすべてのペアAとB、nに変換Aする必要のある操作の最小数を表す自然数に割り当てる関数Bです。許可される操作は次のとおりです。

から記号を削除しますA。
に記号を挿入しますA。
の記号を置き換えAます。

編集距離は、（変換がする操作のシーケンスのように対称であることに注意AするBことは、変換操作の「反転」配列構築することが可能である）BにしますA。

レーベンシュタイン距離に関するウィキペディアの記事には、いくつかの便利なプロパティがリストされています。

最後に、例として、2つのベクトルを変換してみましょう。

[10011]
// Insert 1 into position 2:
[101011]
// Insert 0 into position 5:
[1010101]
// Insert 0 into position 7:
[10101010]

3つの操作のシーケンスが見つかりました。より短いシーケンスがないことを証明できれば、V1との間の距離V2は3であると結論付けることができます。レーベンシュタイン距離は常に少なくとも2つの文字列間のサイズの違いであることを考えると（その理由を考えてください）、それから私達は私達の結論を持っています：

levenshtein_distance(V1,V2) == 3 // returns true!

お役に立てれば！

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-26

コメントを追加

サインイン

分類Dev

特徴ベクトルを使用して2つの画像間の類似度スコアを計算するにはどうすればよいですか？

分類Dev

Rで長さが異なる2つのベクトルで一致する値を見つける

分類Dev

1つのベクトルと行列のコサイン類似度を見つける方法

分類Dev

2つのベクトルの類似性を見つける方法

分類Dev

2 つのベクトル間の類似度を計算する

分類Dev

大きな行列で類似のベクトルを見つけるPython最速の方法

分類Dev

類似のベクトルの頻度を計算する

分類Dev

類似していて別のベクトルで利用可能な値を見つける

分類Dev

長さが異なる2つのベクトルを反復します

分類Dev

特別なベクトルのコサイン類似度（1つのコンポーネントのみ）

分類Dev

R：異なる長さのベクトルを比較します

分類Dev

ヒストグラム間の類似性のパーセンテージを計算する方法（特徴ベクトル）

分類Dev

Rでサブベクトルの長さを見つける

分類Dev

2つ以上の長さが等しくないベクトルに存在する値を見つける

分類Dev

機械学習で異なる次元の特徴ベクトルを処理する方法は？

分類Dev

SVMで異なるサイズの特徴ベクトルをエンコードする方法

分類Dev

特定のベクトルに類似したすべてのベクトルをすばやく見つける方法

分類Dev

2つのベクトルの各単語間のJaccard類似度を計算します

分類Dev

異なる長さの2つのベクトルに関数を適用し、Rで行列を返します

分類Dev

異なる長さの2つのベクトルに関数を適用し、Rで行列を返します

分類Dev

PySparkで2つのベクトルのコサイン類似度を計算する方法は？

分類Dev

featuretools / DFSはどのような特徴ベクトルを生成しますか？

分類Dev

異なる形式の文字列間の類似性を見つけるPython関数

分類Dev

異なる長さのベクトルを構築する

分類Dev

Pysparkは特徴ベクトルの値を更新します

分類Dev

分類のためにガボールフィルターから特徴ベクトルを作成する

分類Dev

データベース内の類似点を見つけるには、どのようなアルゴリズムを使用する必要がありますか？

分類Dev

豚の特徴からなるマットファイルを見つける方法

分類Dev

Matlab：長さと値が異なる2つのベクトルを比較しますか？

Related 関連記事

記事