Rの他のデータフレームからデータフレームに欠落している行を追加します

debugcn 投稿 Dev

ローズ

不足しているデータをデータフレームに入力しようとしています。

2つのデータフレームがありますが、それぞれに他のフレームにない情報が含まれています。これらは次のようになります。ここで、xは数字です。

           DATA FRAME 1                                      DATA FRAME 2    
    Headword   Spelling   Freq                    Headword     Spelling   Freq
     Word1       Sp1a      x                        Word1         Sp1a      x
     Word1       Sp1b      x                        Word1         Sp1c      x
     Word1       Sp1d      x                        Word2         Sp2a      x
     Word2       Sp2a      x                        Word2         Sp2b      x     etc

したがって、DF1にはWord 1のスペル1a、1b、および1dがあります。DF2にはWord1のスペル1aおよび1cがあります。ただし、DF1にはWord2のスペル2aしかありませんが、DF2にはWord2のスペル2aと2bがあります。

私が必要としているのは、両方のデータフレームに、そのデータに存在しない場合でも、すべてのスペルを含めることです。したがって、データフレーム1でSp1cが欠落している場合は、Sp1cが存在し、頻度= 0である必要があります。

だから私はそれをこのように見せたいです：

    DATA FRAME 1                               DATA FRAME 2
Headword Spelling Freq                    Headword Spelling Freq
  Word1    Sp1a    x                        Word1    Sp1a     x
  Word1    Sp1b    x                        Word1    Sp1b     0
  Word1    Sp1c    0                        Word1    Sp1c     x
  Word1    Sp1d    x                        Word1    Sp1d     0
  Word2    Sp2a    x                        Word2    Sp2a     x
  Word2    Sp2b    0                        Word2    Sp2b     x

これを機能させるには、複数の結合を使用してそれらを組み合わせる必要があると思いますが、方法がわかりません。

データフレーム2の欠落している値をデータフレーム1の見出しとスペルの列に追加してから、頻度を0に設定するにはどうすればよいですか？（逆に、欠落している値をデータフレーム1に追加します。）

ArunK

dplyrライブラリを使用して、最初にデータフレームを作成します

library("dplyr")
df1<- data.frame(headword = c("word1","word1","word1","word2"),
                spelling = c("sp1a","sp1b","sp1d","sp2a"),
                freq = runif(1:4))
df2 <-data.frame(headword = c("word1","word1","word2","word2"),
                 spelling = c("sp1a","sp1c","sp2a","sp2b"),
                 freq = runif(1:4))

ここで、df2にないdf1の値を見つけます。

sub_res1 <- anti_join(df1,df2,by=c("headword","spelling"))
#       headword spelling      freq
#  1    word1     sp1b 0.6738556
#  2    word1     sp1d 0.4972938
sub_res1$freq <- 0
df2 <- full_join(df2,sub_res1,by=c("headword","spelling","freq"))

#    headword spelling       freq
#  1    word1     Sp1a 0.50293511
#  2    word1     sp1c 0.67857973
#  3    word2     sp2a 0.05604982
#  4    word2     sp2b 0.83378253
#  5    word1     sp1b 0.00000000
#  6    word1     sp1d 0.00000000

逆に、df1にないdf2の値をfreqを0としてマージします。

明確化：あなたの質問では、あなたはx任意の数を意味していたので、私はを使用runifする代わりにいくつかの任意の数を生成していましたx。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-07-16

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

Rの他のデータフレームからデータフレームに欠落している行を追加します

Rの他のデータフレームからデータフレームに欠落している行を追加します

欠落している行の明示的な表現をデータフレームに追加しますか？

データが欠落しているデータフレームに値が「0」の行を追加する

R または Python のデータ フレームに欠落している秒を追加する

欠落している日時値に基づいて空のデータフレーム行を追加する

パンダは範囲からデータフレームに欠落している週を追加します

Rのデータフレームで値が欠落している行の割合を決定します

データフレームの欠落している行を修復する

データフレームに欠落しているデータの行を作成する方法

データフレーム内の欠落している値のみを別のデータフレームからの値で埋めます

データが欠落しているデータフレームの行に適用を使用し、行ごとに関数を変更します-r

欠落している行と補間された値をRのデータフレームに追加するにはどうすればよいですか？

Rデータフレームの欠落している行を埋めます

データフレームに欠落している日を追加する

観測値が欠落している場合は、データフレームに行を追加します

データフレームで欠落している日付をどのように管理しますか？

R：値が欠落している列をデータフレームに追加します

パンダの状態に基づいて、あるデータフレームから別のデータフレームに欠落している行を追加するにはどうすればよいですか？

欠落している行を追加し、現在のデータフレームに基づいて列の値をゼロに設定します

データフレームの欠落している行を埋める

あるデータフレームから別のデータフレームで欠落している値を検索する正しい方法

データフレームから欠落している行をゼロで埋めます

null値のデータフレームに欠落している月を追加する

データフレームからダミー変数の行列を作成します。欠落している値には `NA`を使用します

データフレーム列の欠落している値をRの列中央値で埋めます

時系列データの欠落している行をPythonのパンダデータフレームに追加する方法

欠落しているすべての日付データフレームの前日の行を複製する

欠落しているデータを、別のデータフレーム内の一致する行の値に置き換えます

欠落している年をデータフレームに追加します（再形成）

データフレームpythonの特定の場所から値が欠落している行を削除します

R または Python のデータフレームに欠落している秒を追加する