パンダ:2つの異なるデータフレームでforループを繰り返すにはどうすればよいですか?

Sravee

2つのデータフレームの複数の行のファズ率を計算しようとしています。

df1:

id    name
1     Ab Cd E
2     X.Y!Z
3     fgh I

df2:

name_2
abcde
xyz

df1.nameとdf2.name_2のすべての値の間のファズ比を計算したい:

それを行うために私はコードを持っています:

for i in df1['name']:
    for r in df2['name_2']:
        print(fuzz.ratio(i,r))

しかし、最終結果にはdf1のIDも含める必要があります。理想的には次のようになります。

final_df:

id      name        name_2    score
1      Ab Cd E      abcde      50
1      Ab Cd E       xyz        0
2       X.Y!Z       abcde       0
2       X.Y!Z        xyz       60
3       fgh I       abcde       0
3       fgh I        xyz        0

助けてくれてありがとう!

エヴァン

でのラムダ関数の適用を完全には理解していませんpd.applyが、SOを検索した後、これは妥当な解決策だと思います。

import pandas as pd
from fuzzywuzzy import fuzz

d = [{'id': 1, 'name': 'Ab Cd e'}, {'id': 2, 'name': 'X.Y!Z'}, {'id': 3, 'name': 'fgh I'}] 
df1 = pd.DataFrame(d)
df2 = pd.DataFrame({'name_2': ['abcde', 'xyz']})

これはパンダのクロス結合です。tmpdfが必要ですパンダは共通の列をクロス結合しません

df1['tmp'] = 1
df2['tmp'] = 1

df = pd.merge(df1, df2, on=['tmp'])
df = df.drop('tmp', axis=1)

列に.apply関数fuzz.ratioを実行できますdfパンダ:複数の列に適用機能を使用する方法

df['fuzz_ratio'] = df.apply(lambda row: fuzz.ratio(row['name'], row['name_2']), axis = 1)

df

また、にインデックスを設定しようとdf1しましたが、その結果、相互結合されたdfから除外されました。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

パンダ:まったく同じ形式の2つのデータフレームを繰り返すにはどうすればよいですか?

分類Dev

繰り返す値を持つパンダデータフレームに列を追加するにはどうすればよいですか?

分類Dev

2つの異なるパンダデータフレームで値を相互に比較するにはどうすればよいですか

分類Dev

Pandasデータフレームの多くの行にランダムな値を繰り返し追加するにはどうすればよいですか?

分類Dev

WordPressのカスタム投稿で繰り返さずに2つの異なるDIVSにループするにはどうすればよいですか?

分類Dev

2つのパンダデータフレームから各セルのタプルを作成するにはどうすればよいですか?

分類Dev

Pandasデータフレームの1つの列にある2つの繰り返し値の間のセル内(インデックスなど)の距離をカウントするにはどうすればよいですか?

分類Dev

パンダのデータフレーム全体で反復を繰り返すにはどうすればよいですか?

分類Dev

パンダデータフレームの4つのレベルから2つのビンを作成するにはどうすればよいですか?

分類Dev

繰り返しなしでデータフレームの2列ごとに関数を適用するにはどうすればよいですか?

分類Dev

異なるデータフレームパンダの同じIDで異なる値を比較するにはどうすればよいですか?

分類Dev

2つのデータフレームからより大きなデータフレームを返すにはどうすればよいですか

分類Dev

txtファイルには2つの異なるタイプのデータがあります。パンダを使用して各行を相互作用させ、対応するデータを追加するにはどうすればよいですか。

分類Dev

個別のデータフレーム内の各値のデータフレームに対して各行を繰り返し、2つを1つのデータフレームに結合するにはどうすればよいですか?

分類Dev

個別のデータフレーム内の各値のデータフレームに対して各行を繰り返し、2つを1つのデータフレームに結合するにはどうすればよいですか?

分類Dev

すべての列に異なる繰り返しパターンを持つ行列を設定するにはどうすればよいですか?

分類Dev

各リストアイテムを異なるパンダデータフレームに割り当てるにはどうすればよいですか?

分類Dev

jinja2でパンダデータフレームの行と列をループするにはどうすればよいですか?

分類Dev

パンダのデータフレームに各グループの上位[2-31]行を保持するにはどうすればよいですか?

分類Dev

一度に異なるサイズの値をパンダのデータフレームに追加するにはどうすればよいですか?

分類Dev

2つのパンダデータフレームのセル値を結合するにはどうすればよいですか?

分類Dev

パンダデータフレームの行(列ではなく)を繰り返しのあるリストで分割するにはどうすればよいですか?

分類Dev

パンダ:2つのデータフレームの和集合からダミーの変数列を取得するにはどうすればよいですか?

分類Dev

パンダのデータフレーム列でグループ化し、同じExcelファイルの複数のシートに異なるグループを保存するにはどうすればよいですか?

分類Dev

インデックスが異なる2つのデータフレームをマージするにはどうすればよいですか?

分類Dev

データフレーム列で繰り返される値の頻度をカウントするにはどうすればよいですか?

分類Dev

データフレーム内の値の列で、その列のすべての値に対して繰り返す必要なしに、ランダムで均一な分布を生成するにはどうすればよいですか?

分類Dev

パンダの1つの列を除いて2つのデータフレームを区別するにはどうすればよいですか?

分類Dev

区切り文字がないようにパンダのデータフレームを保存するにはどうすればよいですか?

Related 関連記事

  1. 1

    パンダ:まったく同じ形式の2つのデータフレームを繰り返すにはどうすればよいですか?

  2. 2

    繰り返す値を持つパンダデータフレームに列を追加するにはどうすればよいですか?

  3. 3

    2つの異なるパンダデータフレームで値を相互に比較するにはどうすればよいですか

  4. 4

    Pandasデータフレームの多くの行にランダムな値を繰り返し追加するにはどうすればよいですか?

  5. 5

    WordPressのカスタム投稿で繰り返さずに2つの異なるDIVSにループするにはどうすればよいですか?

  6. 6

    2つのパンダデータフレームから各セルのタプルを作成するにはどうすればよいですか?

  7. 7

    Pandasデータフレームの1つの列にある2つの繰り返し値の間のセル内(インデックスなど)の距離をカウントするにはどうすればよいですか?

  8. 8

    パンダのデータフレーム全体で反復を繰り返すにはどうすればよいですか?

  9. 9

    パンダデータフレームの4つのレベルから2つのビンを作成するにはどうすればよいですか?

  10. 10

    繰り返しなしでデータフレームの2列ごとに関数を適用するにはどうすればよいですか?

  11. 11

    異なるデータフレームパンダの同じIDで異なる値を比較するにはどうすればよいですか?

  12. 12

    2つのデータフレームからより大きなデータフレームを返すにはどうすればよいですか

  13. 13

    txtファイルには2つの異なるタイプのデータがあります。パンダを使用して各行を相互作用させ、対応するデータを追加するにはどうすればよいですか。

  14. 14

    個別のデータフレーム内の各値のデータフレームに対して各行を繰り返し、2つを1つのデータフレームに結合するにはどうすればよいですか?

  15. 15

    個別のデータフレーム内の各値のデータフレームに対して各行を繰り返し、2つを1つのデータフレームに結合するにはどうすればよいですか?

  16. 16

    すべての列に異なる繰り返しパターンを持つ行列を設定するにはどうすればよいですか?

  17. 17

    各リストアイテムを異なるパンダデータフレームに割り当てるにはどうすればよいですか?

  18. 18

    jinja2でパンダデータフレームの行と列をループするにはどうすればよいですか?

  19. 19

    パンダのデータフレームに各グループの上位[2-31]行を保持するにはどうすればよいですか?

  20. 20

    一度に異なるサイズの値をパンダのデータフレームに追加するにはどうすればよいですか?

  21. 21

    2つのパンダデータフレームのセル値を結合するにはどうすればよいですか?

  22. 22

    パンダデータフレームの行(列ではなく)を繰り返しのあるリストで分割するにはどうすればよいですか?

  23. 23

    パンダ:2つのデータフレームの和集合からダミーの変数列を取得するにはどうすればよいですか?

  24. 24

    パンダのデータフレーム列でグループ化し、同じExcelファイルの複数のシートに異なるグループを保存するにはどうすればよいですか?

  25. 25

    インデックスが異なる2つのデータフレームをマージするにはどうすればよいですか?

  26. 26

    データフレーム列で繰り返される値の頻度をカウントするにはどうすればよいですか?

  27. 27

    データフレーム内の値の列で、その列のすべての値に対して繰り返す必要なしに、ランダムで均一な分布を生成するにはどうすればよいですか?

  28. 28

    パンダの1つの列を除いて2つのデータフレームを区別するにはどうすればよいですか?

  29. 29

    区切り文字がないようにパンダのデータフレームを保存するにはどうすればよいですか?

ホットタグ

アーカイブ