Rは、複数の列が重なる場合にのみデータフレームをマージします

ヤック

2つの大きなデータフレームがあります(両方とも+ -300k行)。データフレームAには、遺伝子に関する情報が含まれています。特定の値が重複している場合は、データフレームBからこのデータフレームに情報を追加したいと思います。df.B $ X1 = df.A $ X1&df.B $ X2 = df.A $ X2であるdf.Bの行が存在する場合、df.B $ X3の値を新しい値に追加する必要があります。 df.A(df.A $ X3)の列、特に右側の行。基本的に、列X1とX2に基づいてdf.Aとdf.Bをマージします。私はforループから始めましたが、もっと簡単な方法があるはずです...私の質問を十分に説明したことを願っています。

ありがとう!

> df.A
  X1 X2
1  1  1
2  1  2
3  1  3
4  2  1
5  2  2
6  2  3

> df.B
  X1 X2  X3
1  1  1 0.5
2  1  8 0.3
3  1  9 0.2
4  2  2 0.4
5  2  9 0.3
6  2 10 0.2

望ましい結果:

> df.A
  X1 X2 X3
1  1  1 0.5
2  1  2 NA
3  1  3 NA
4  2  1 NA
5  2  2 0.4
6  2  3 NA
地震

左結合が必要

dplyr

library(dplyr)
df.A %>% left_join(df.B, by = c("X1","X2"))

データ表

library(data.table)
merge(setDT(df.A), setDT(df.B), all.x = TRUE, by = c("X1","X2"))

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

列の値が同じ場合にのみデータフレームをマージします

分類Dev

データフレームに同じ名前の複数の列がある場合、マージは失敗します

分類Dev

複数の一致するデータフレームをマージする場合は、最初の行のみを選択します

分類Dev

Rで重複しないデータを維持しながら、複数の同様の列で2つのデータフレームを結合する

分類Dev

1つの列のデータが別の列に存在する場合は、2つのデータフレームをマージします

分類Dev

Python:データの重複なしにデータフレームの複数の列をマージします

分類Dev

結合タイプが異なる複数の列のPythonデータフレームをマージする

分類Dev

Pysparkデータフレームは、重複する列名がほとんどなく、重複する列がない場合に結合します

分類Dev

Rのすべてのデータフレームにすべての列が存在しない場合は、列ごとにデータフレームをマージします

分類Dev

列のデータフレームに複数の値がある場合は、複数の行を作成します

分類Dev

2つのパンダデータフレームをマージすると、列が「重複」します

分類Dev

パンダ:列の値が繰り返されている列で複数のデータフレームを結合またはマージします

分類Dev

レコードが他のデータフレームと重複している場合は、データフレームを変更します

分類Dev

一部の列が共通している場合は、マスターデータフレームにデータフレームを追加します

分類Dev

任意の行の値が別のデータフレームである場合にデータフレームは複数の列を有する、データフレームから行を削除します

分類Dev

列に複数の値がある可能性がある場合は、データフレーム列をintdtypeに変換します

分類Dev

最初のデータフレームの列のデータがPythonの別のデータフレームの列のいずれかに存在する場合、2つのデータフレームをマージします

分類Dev

R:列数が素数の場合にデータフレームを分割する

分類Dev

キーが文字列/整数の場合、辞書内の複数のパンダデータフレームをマージします

分類Dev

複数のデータフレームをデータフレームのリストに保存し、そのうちの1つを思い出した場合、出力の列ヘッダーをフォーマットする方法はありますか?

分類Dev

パンダ:列の値に基づいて2つのデータフレームをマージします。同じ列値を含む複数の行の場合、それらを異なる列に追加します

分類Dev

Rの複数の列に基づいて2つのデータフレームをマージします

分類Dev

データフレームのマージで値が等しい場合、行に列を追加します

分類Dev

データフレーム内の列の値をマージするときに重複を削除しないのはなぜですか?

分類Dev

各csvに複数の共通列がある場合に、複数のcsvを1つのデータフレームに読み込むのに最適な方法

分類Dev

列にサイクルがある場合は、データフレームの行を複数の行に変換します

分類Dev

3つのデータフレームのコンテンツをRの1つの列にマージします(複数の列にまたがって)

分類Dev

R-1つのデータフレームを複数のデータフレームに個別にマージ/結合します

分類Dev

複数の値に一致する場合は、Pandasデータフレームの行を削除します

Related 関連記事

  1. 1

    列の値が同じ場合にのみデータフレームをマージします

  2. 2

    データフレームに同じ名前の複数の列がある場合、マージは失敗します

  3. 3

    複数の一致するデータフレームをマージする場合は、最初の行のみを選択します

  4. 4

    Rで重複しないデータを維持しながら、複数の同様の列で2つのデータフレームを結合する

  5. 5

    1つの列のデータが別の列に存在する場合は、2つのデータフレームをマージします

  6. 6

    Python:データの重複なしにデータフレームの複数の列をマージします

  7. 7

    結合タイプが異なる複数の列のPythonデータフレームをマージする

  8. 8

    Pysparkデータフレームは、重複する列名がほとんどなく、重複する列がない場合に結合します

  9. 9

    Rのすべてのデータフレームにすべての列が存在しない場合は、列ごとにデータフレームをマージします

  10. 10

    列のデータフレームに複数の値がある場合は、複数の行を作成します

  11. 11

    2つのパンダデータフレームをマージすると、列が「重複」します

  12. 12

    パンダ:列の値が繰り返されている列で複数のデータフレームを結合またはマージします

  13. 13

    レコードが他のデータフレームと重複している場合は、データフレームを変更します

  14. 14

    一部の列が共通している場合は、マスターデータフレームにデータフレームを追加します

  15. 15

    任意の行の値が別のデータフレームである場合にデータフレームは複数の列を有する、データフレームから行を削除します

  16. 16

    列に複数の値がある可能性がある場合は、データフレーム列をintdtypeに変換します

  17. 17

    最初のデータフレームの列のデータがPythonの別のデータフレームの列のいずれかに存在する場合、2つのデータフレームをマージします

  18. 18

    R:列数が素数の場合にデータフレームを分割する

  19. 19

    キーが文字列/整数の場合、辞書内の複数のパンダデータフレームをマージします

  20. 20

    複数のデータフレームをデータフレームのリストに保存し、そのうちの1つを思い出した場合、出力の列ヘッダーをフォーマットする方法はありますか?

  21. 21

    パンダ:列の値に基づいて2つのデータフレームをマージします。同じ列値を含む複数の行の場合、それらを異なる列に追加します

  22. 22

    Rの複数の列に基づいて2つのデータフレームをマージします

  23. 23

    データフレームのマージで値が等しい場合、行に列を追加します

  24. 24

    データフレーム内の列の値をマージするときに重複を削除しないのはなぜですか?

  25. 25

    各csvに複数の共通列がある場合に、複数のcsvを1つのデータフレームに読み込むのに最適な方法

  26. 26

    列にサイクルがある場合は、データフレームの行を複数の行に変換します

  27. 27

    3つのデータフレームのコンテンツをRの1つの列にマージします(複数の列にまたがって)

  28. 28

    R-1つのデータフレームを複数のデータフレームに個別にマージ/結合します

  29. 29

    複数の値に一致する場合は、Pandasデータフレームの行を削除します

ホットタグ

アーカイブ