Rは、複数の列が重なる場合にのみデータフレームをマージします

debugcn 投稿 Dev

ヤック

2つの大きなデータフレームがあります（両方とも+ -300k行）。データフレームAには、遺伝子に関する情報が含まれています。特定の値が重複している場合は、データフレームBからこのデータフレームに情報を追加したいと思います。df.B $ X1 = df.A $ X1＆df.B $ X2 = df.A $ X2であるdf.Bの行が存在する場合、df.B $ X3の値を新しい値に追加する必要があります。 df.A（df.A $ X3）の列、特に右側の行。基本的に、列X1とX2に基づいてdf.Aとdf.Bをマージします。私はforループから始めましたが、もっと簡単な方法があるはずです...私の質問を十分に説明したことを願っています。

ありがとう！

> df.A
  X1 X2
1  1  1
2  1  2
3  1  3
4  2  1
5  2  2
6  2  3

> df.B
  X1 X2  X3
1  1  1 0.5
2  1  8 0.3
3  1  9 0.2
4  2  2 0.4
5  2  9 0.3
6  2 10 0.2

望ましい結果：

> df.A
  X1 X2 X3
1  1  1 0.5
2  1  2 NA
3  1  3 NA
4  2  1 NA
5  2  2 0.4
6  2  3 NA

地震

左結合が必要

dplyr

library(dplyr)
df.A %>% left_join(df.B, by = c("X1","X2"))

データ表

library(data.table)
merge(setDT(df.A), setDT(df.B), all.x = TRUE, by = c("X1","X2"))

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-12

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

Rは、複数の列が重なる場合にのみデータフレームをマージします

Rは、複数の列が重なる場合にのみデータフレームをマージします

dplyr

データ表

列の値が同じ場合にのみデータフレームをマージします

データフレームに同じ名前の複数の列がある場合、マージは失敗します

複数の一致するデータフレームをマージする場合は、最初の行のみを選択します

Rで重複しないデータを維持しながら、複数の同様の列で2つのデータフレームを結合する

1つの列のデータが別の列に存在する場合は、2つのデータフレームをマージします

Python：データの重複なしにデータフレームの複数の列をマージします

結合タイプが異なる複数の列のPythonデータフレームをマージする

Pysparkデータフレームは、重複する列名がほとんどなく、重複する列がない場合に結合します

Rのすべてのデータフレームにすべての列が存在しない場合は、列ごとにデータフレームをマージします

列のデータフレームに複数の値がある場合は、複数の行を作成します

2つのパンダデータフレームをマージすると、列が「重複」します

パンダ：列の値が繰り返されている列で複数のデータフレームを結合またはマージします

レコードが他のデータフレームと重複している場合は、データフレームを変更します

一部の列が共通している場合は、マスターデータフレームにデータフレームを追加します

任意の行の値が別のデータフレームである場合にデータフレームは複数の列を有する、データフレームから行を削除します

列に複数の値がある可能性がある場合は、データフレーム列をintdtypeに変換します

最初のデータフレームの列のデータがPythonの別のデータフレームの列のいずれかに存在する場合、2つのデータフレームをマージします

R：列数が素数の場合にデータフレームを分割する

キーが文字列/整数の場合、辞書内の複数のパンダデータフレームをマージします

複数のデータフレームをデータフレームのリストに保存し、そのうちの1つを思い出した場合、出力の列ヘッダーをフォーマットする方法はありますか？

パンダ：列の値に基づいて2つのデータフレームをマージします。同じ列値を含む複数の行の場合、それらを異なる列に追加します

Rの複数の列に基づいて2つのデータフレームをマージします

データフレームのマージで値が等しい場合、行に列を追加します

データフレーム内の列の値をマージするときに重複を削除しないのはなぜですか？

各csvに複数の共通列がある場合に、複数のcsvを1つのデータフレームに読み込むのに最適な方法

列にサイクルがある場合は、データフレームの行を複数の行に変換します

3つのデータフレームのコンテンツをRの1つの列にマージします（複数の列にまたがって）

R-1つのデータフレームを複数のデータフレームに個別にマージ/結合します

複数の値に一致する場合は、Pandasデータフレームの行を削除します