データフレーム間でほぼ同一の行を見つける

オムリー・アティア

次の2つのデータフレームがあります。

df1 = data_frame(x = c(1128.4, 1101.2), y = c(124.5, 325.2)

df2 = data_frame(x = c(1128.7, 1100.5, 1527.8, 1347.5), y = c(83.2, 124.2, 
370.3, 325.5))

私は、内の行を見つけるしたいdf1ことがあるほとんど同一の行に(いずれかの方向に1%の差)df2内の行数百人のためにこれを行うことができるように非常に効率的な方法では、df1はるかに大きい対df2

期待される出力は、たとえばリストです。

L$x = c(1,2)
L$y = c(2,4)

各列の類似した行を示します。

割り当てが完全に同一の行を見つけることであった場合、left_joinもちろん、小さい方df1が左側にある場合に使用します。

これを行う効率的な方法はありますか?(一般的に、これは複数の列でも実現したいと思います)。

デニス

を使用data.tableすると、最速のソリューションが得られます。

library(data.table)
df1 = data.table(x = c(1128.4, 1101.2))
df2 = data.table(x = c(1128.7, 1100.5, 1527.8, 1347.5))

setkey(df2,x)
df2[,y := x]
df2[J(df1$x),roll = "nearest"][abs(x-y)/y < 0.01]

        x      y
1: 1128.4 1128.7
2: 1101.2 1100.5

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

Rのデータフレーム内のほぼ同一の行をマージする

分類Dev

データフレームの行で一意のIDを見つける

分類Dev

Rの条件によってほぼ同一のデータフレーム行を削除します

分類Dev

ほぼ重複している、つまり2エントリ未満の違いがあるデータフレームの行数を見つける方法は?

分類Dev

2つのデータフレーム間で等しい列を見つける

分類Dev

最初の単語だけで2つのデータフレーム間で一致する行を見つける

分類Dev

2つのパンダデータフレーム間で更新された行を見つける方法

分類Dev

パンダのデータフレームで前の行を見つける

分類Dev

データフレーム内の2つの「ほぼ重複する」の間で最も長い文字列を選択します

分類Dev

文字列のリストからほぼ一致するフレーズを見つける

分類Dev

2 つの pandas データフレームの行間の違いを見つける

分類Dev

送信ボタンのクリックに反応するこれらのほぼ同一のHTMLフォームの1つだけがなぜですか?

分類Dev

ほぼ同じタスクを実行するために使用されている2つのほぼ同一のC ++関数(25個の数値の行の平均を見つける)ですが、機能しているのは1つだけですか?

分類Dev

行ごとに2つのデータフレーム間の類似性を見つける

分類Dev

値としてNAを含む、データフレーム間で等しい行を見つける

分類Dev

2つのデータフレーム間で重複する領域を見つける

分類Dev

PySparkで2つのデータフレーム間の変更を見つける

分類Dev

データフレーム間隔内の最大値を見つける

分類Dev

pandasデータフレームで正と負の両方の値を持つ行を見つける方法

分類Dev

パンダのデータフレーム行で最後のクラスターを見つける方法は?

分類Dev

2つのデータフレーム間で同一のペア値を検索する

分類Dev

2つのデータフレームで共通の要素を見つける

分類Dev

データフレームで最適な行を見つける

分類Dev

データフレーム内のループなしで別の関連する行を見つける方法

分類Dev

2つのPandasデータフレームで共通の行(交差)を見つける

分類Dev

複数のデータフレーム列間で共通の要素を見つける

分類Dev

2つのデータフレーム間で完全一致と非完全一致を見つける方法は?

分類Dev

2つのデータフレームの各行で一般的な単語(共通部分)を見つける

分類Dev

正のタイムデルタを持つデータフレーム間の最も近い行を見つける

Related 関連記事

  1. 1

    Rのデータフレーム内のほぼ同一の行をマージする

  2. 2

    データフレームの行で一意のIDを見つける

  3. 3

    Rの条件によってほぼ同一のデータフレーム行を削除します

  4. 4

    ほぼ重複している、つまり2エントリ未満の違いがあるデータフレームの行数を見つける方法は?

  5. 5

    2つのデータフレーム間で等しい列を見つける

  6. 6

    最初の単語だけで2つのデータフレーム間で一致する行を見つける

  7. 7

    2つのパンダデータフレーム間で更新された行を見つける方法

  8. 8

    パンダのデータフレームで前の行を見つける

  9. 9

    データフレーム内の2つの「ほぼ重複する」の間で最も長い文字列を選択します

  10. 10

    文字列のリストからほぼ一致するフレーズを見つける

  11. 11

    2 つの pandas データフレームの行間の違いを見つける

  12. 12

    送信ボタンのクリックに反応するこれらのほぼ同一のHTMLフォームの1つだけがなぜですか?

  13. 13

    ほぼ同じタスクを実行するために使用されている2つのほぼ同一のC ++関数(25個の数値の行の平均を見つける)ですが、機能しているのは1つだけですか?

  14. 14

    行ごとに2つのデータフレーム間の類似性を見つける

  15. 15

    値としてNAを含む、データフレーム間で等しい行を見つける

  16. 16

    2つのデータフレーム間で重複する領域を見つける

  17. 17

    PySparkで2つのデータフレーム間の変更を見つける

  18. 18

    データフレーム間隔内の最大値を見つける

  19. 19

    pandasデータフレームで正と負の両方の値を持つ行を見つける方法

  20. 20

    パンダのデータフレーム行で最後のクラスターを見つける方法は?

  21. 21

    2つのデータフレーム間で同一のペア値を検索する

  22. 22

    2つのデータフレームで共通の要素を見つける

  23. 23

    データフレームで最適な行を見つける

  24. 24

    データフレーム内のループなしで別の関連する行を見つける方法

  25. 25

    2つのPandasデータフレームで共通の行(交差)を見つける

  26. 26

    複数のデータフレーム列間で共通の要素を見つける

  27. 27

    2つのデータフレーム間で完全一致と非完全一致を見つける方法は?

  28. 28

    2つのデータフレームの各行で一般的な単語(共通部分)を見つける

  29. 29

    正のタイムデルタを持つデータフレーム間の最も近い行を見つける

ホットタグ

アーカイブ