2つの列間の一致する値(正確)に基づいてデータフレームをフィルタリングします

来た

2つの列を持つデータフレームがあります。1つの列には文のリストが含まれ、他の列には単語が含まれます。例えば:

words   sentences
loose   Loose connection several times a day on my tablet.  
loud    People don't speak loud or clear enough to hear voicemails
vice    I strongly advice you to fix this issue
advice  I strongly advice you to fix this issue

次に、このデータフレームをフィルタリングして、文の単語と完全に一致する単語を含む行のみを取得するようにします。

words   sentences
loose   Loose connection several times a day on my tablet.  
loud    People don't speak loud or clear enough to hear voicemails
advice  I strongly advice you to fix this issue   

「vice」という単語は完全に一致しなかったため、削除する必要があります。データフレームに2万行近くあります。パフォーマンスをあまり低下させないように、このタスクを実行するために使用する方法を誰かに提案してもらえますか。

サンディパンデイ

次のようなことを試すことができます。

df[apply(df, 1, function(x) tolower(x[1]) %in% tolower(unlist(strsplit(x[2], split='\\s+')))),]

df
   words                                                sentences
1  loose       Loose connection several times a day on my tablet.
2   loud People dont speak loud or clear enough to hear voicemail
4 advice          advice  I strongly advice you to fix this issue

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

2つのデータフレーム間の比較一致に基づいて列を作成します

分類Dev

列内の一致した値、および一致した値の最小/最大値のタイムスタンプに基づいてデータフレームをフィルタリングします

分類Dev

部分的な文字列の一致に基づいてパンダを使用してPythonでデータフレームをフィルタリングする

分類Dev

パンダは、一致する複数の列値に基づいて2つのデータフレームをマージします

分類Dev

列値のペア間の最も近い一致に基づいて2つのデータフレームをマージします

分類Dev

2つのデータフレームで一致した値に基づいてインクリメンタルIDを生成する

分類Dev

2つの列間の時間差に基づいてpysparkデータフレームをフィルタリングします

分類Dev

文字列の完全一致に基づいてパンダデータフレームをフィルタリングする

分類Dev

2番目のデータフレームの一致する列に基づいてパンダのデータフレームを更新します

分類Dev

2つのデータフレームを比較し、一致する列の値に基づいてdfから行を削除します

分類Dev

2つのデータフレーム間の部分的な文字列に基づいて一致する行を取得します

分類Dev

データフレーム内の2つの異なる列間の一致に基づいて行を削除します

分類Dev

2つのデータフレームからの2つの既存の列間の一致に基づいて頻度を追加します

分類Dev

2列の一致する行に基づいて2つのデータフレームをパンダとマージします

分類Dev

2つの日付の間でフィルタリングされた時間に基づいて新しいデータフレームを作成する方法

分類Dev

列の値に基づいてデータフレームの行をフィルタリングする

分類Dev

一致する列データに基づいて2つのCSVファイルを結合します

分類Dev

データ内の一致に基づいてデータをフィルタリングする

分類Dev

2つのデータフレームを比較し、rの値に基づいて値をフィルタリングします

分類Dev

Rの2つのデータフレームの2つの列の一致するペア名に基づいて、別のデータフレームの他の値に値を追加します

分類Dev

Pythonで配列の値に基づいてデータフレームをフィルタリングする

分類Dev

Sparkデータフレームscalaの列値に基づいて行をフィルタリングする

分類Dev

一意の値に基づいてデータフレーム全体をフィルタリングし、Rに新しい列を作成します

分類Dev

R-既存の列と一致する値のインデックスに基づいて新しい列データフレームを作成します

分類Dev

完全に一致する日付値に基づいてパンダデータフレームをフィルタリングする方法

分類Dev

別の列のnull値に基づいてデータフレーム列の値をフィルタリングするpythonデータフレーム

分類Dev

別の列のnull値に基づいてデータフレーム列の値をフィルタリングするpythonデータフレーム

分類Dev

データフレームとの一致に基づいて大きな名前付きリストをフィルタリングする

分類Dev

R:別のデータフレームの一致する行に基づいて列を更新します

Related 関連記事

  1. 1

    2つのデータフレーム間の比較一致に基づいて列を作成します

  2. 2

    列内の一致した値、および一致した値の最小/最大値のタイムスタンプに基づいてデータフレームをフィルタリングします

  3. 3

    部分的な文字列の一致に基づいてパンダを使用してPythonでデータフレームをフィルタリングする

  4. 4

    パンダは、一致する複数の列値に基づいて2つのデータフレームをマージします

  5. 5

    列値のペア間の最も近い一致に基づいて2つのデータフレームをマージします

  6. 6

    2つのデータフレームで一致した値に基づいてインクリメンタルIDを生成する

  7. 7

    2つの列間の時間差に基づいてpysparkデータフレームをフィルタリングします

  8. 8

    文字列の完全一致に基づいてパンダデータフレームをフィルタリングする

  9. 9

    2番目のデータフレームの一致する列に基づいてパンダのデータフレームを更新します

  10. 10

    2つのデータフレームを比較し、一致する列の値に基づいてdfから行を削除します

  11. 11

    2つのデータフレーム間の部分的な文字列に基づいて一致する行を取得します

  12. 12

    データフレーム内の2つの異なる列間の一致に基づいて行を削除します

  13. 13

    2つのデータフレームからの2つの既存の列間の一致に基づいて頻度を追加します

  14. 14

    2列の一致する行に基づいて2つのデータフレームをパンダとマージします

  15. 15

    2つの日付の間でフィルタリングされた時間に基づいて新しいデータフレームを作成する方法

  16. 16

    列の値に基づいてデータフレームの行をフィルタリングする

  17. 17

    一致する列データに基づいて2つのCSVファイルを結合します

  18. 18

    データ内の一致に基づいてデータをフィルタリングする

  19. 19

    2つのデータフレームを比較し、rの値に基づいて値をフィルタリングします

  20. 20

    Rの2つのデータフレームの2つの列の一致するペア名に基づいて、別のデータフレームの他の値に値を追加します

  21. 21

    Pythonで配列の値に基づいてデータフレームをフィルタリングする

  22. 22

    Sparkデータフレームscalaの列値に基づいて行をフィルタリングする

  23. 23

    一意の値に基づいてデータフレーム全体をフィルタリングし、Rに新しい列を作成します

  24. 24

    R-既存の列と一致する値のインデックスに基づいて新しい列データフレームを作成します

  25. 25

    完全に一致する日付値に基づいてパンダデータフレームをフィルタリングする方法

  26. 26

    別の列のnull値に基づいてデータフレーム列の値をフィルタリングするpythonデータフレーム

  27. 27

    別の列のnull値に基づいてデータフレーム列の値をフィルタリングするpythonデータフレーム

  28. 28

    データフレームとの一致に基づいて大きな名前付きリストをフィルタリングする

  29. 29

    R:別のデータフレームの一致する行に基づいて列を更新します

ホットタグ

アーカイブ