Rの他のデータフレームからデータフレームに欠落している行を追加します

ローズ

不足しているデータをデータフレームに入力しようとしています。

2つのデータフレームがありますが、それぞれに他のフレームにない情報が含まれています。これらは次のようになります。ここで、xは数字です。

           DATA FRAME 1                                      DATA FRAME 2    
    Headword   Spelling   Freq                    Headword     Spelling   Freq
     Word1       Sp1a      x                        Word1         Sp1a      x
     Word1       Sp1b      x                        Word1         Sp1c      x
     Word1       Sp1d      x                        Word2         Sp2a      x
     Word2       Sp2a      x                        Word2         Sp2b      x     etc

したがって、DF1にはWord 1のスペル1a、1b、および1dがあります。DF2にはWord1のスペル1aおよび1cがあります。ただし、DF1にはWord2のスペル2aしかありませんが、DF2にはWord2のスペル2aと2bがあります。

私が必要としているのは、両方のデータフレームに、そのデータに存在しない場合でも、すべてのスペルを含めることです。したがって、データフレーム1でSp1cが欠落している場合は、Sp1cが存在し、頻度= 0である必要があります。

だから私はそれをこのように見せたいです:

    DATA FRAME 1                               DATA FRAME 2
Headword Spelling Freq                    Headword Spelling Freq
  Word1    Sp1a    x                        Word1    Sp1a     x
  Word1    Sp1b    x                        Word1    Sp1b     0
  Word1    Sp1c    0                        Word1    Sp1c     x
  Word1    Sp1d    x                        Word1    Sp1d     0
  Word2    Sp2a    x                        Word2    Sp2a     x
  Word2    Sp2b    0                        Word2    Sp2b     x

これを機能させるには、複数の結合を使用してそれらを組み合わせる必要があると思いますが、方法がわかりません。

データフレーム2の欠落している値をデータフレーム1の見出しとスペルの列に追加してから、頻度を0に設定するにはどうすればよいですか?(逆に、欠落している値をデータフレーム1に追加します。)

ArunK

dplyrライブラリを使用して、最初にデータフレームを作成します

library("dplyr")
df1<- data.frame(headword = c("word1","word1","word1","word2"),
                spelling = c("sp1a","sp1b","sp1d","sp2a"),
                freq = runif(1:4))
df2 <-data.frame(headword = c("word1","word1","word2","word2"),
                 spelling = c("sp1a","sp1c","sp2a","sp2b"),
                 freq = runif(1:4))

ここで、df2にないdf1の値を見つけます。

sub_res1 <- anti_join(df1,df2,by=c("headword","spelling"))
#       headword spelling      freq
#  1    word1     sp1b 0.6738556
#  2    word1     sp1d 0.4972938
sub_res1$freq <- 0
df2 <- full_join(df2,sub_res1,by=c("headword","spelling","freq"))

#    headword spelling       freq
#  1    word1     Sp1a 0.50293511
#  2    word1     sp1c 0.67857973
#  3    word2     sp2a 0.05604982
#  4    word2     sp2b 0.83378253
#  5    word1     sp1b 0.00000000
#  6    word1     sp1d 0.00000000

逆に、df1にないdf2の値をfreqを0としてマージします。

明確化:あなたの質問では、あなたはx任意の数を意味していたので、私はを使用runifする代わりにいくつかの任意の数を生成していましたx

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

欠落している行の明示的な表現をデータフレームに追加しますか?

分類Dev

データが欠落しているデータフレームに値が「0」の行を追加する

分類Dev

R または Python のデータ フレームに欠落している秒を追加する

分類Dev

欠落している日時値に基づいて空のデータフレーム行を追加する

分類Dev

パンダは範囲からデータフレームに欠落している週を追加します

分類Dev

Rのデータフレームで値が欠落している行の割合を決定します

分類Dev

データフレームの欠落している行を修復する

分類Dev

データフレームに欠落しているデータの行を作成する方法

分類Dev

データフレーム内の欠落している値のみを別のデータフレームからの値で埋めます

分類Dev

データが欠落しているデータフレームの行に適用を使用し、行ごとに関数を変更します-r

分類Dev

欠落している行と補間された値をRのデータフレームに追加するにはどうすればよいですか?

分類Dev

Rデータフレームの欠落している行を埋めます

分類Dev

データフレームに欠落している日を追加する

分類Dev

観測値が欠落している場合は、データフレームに行を追加します

分類Dev

データフレームで欠落している日付をどのように管理しますか?

分類Dev

R:値が欠落している列をデータフレームに追加します

分類Dev

パンダの状態に基づいて、あるデータフレームから別のデータフレームに欠落している行を追加するにはどうすればよいですか?

分類Dev

欠落している行を追加し、現在のデータフレームに基づいて列の値をゼロに設定します

分類Dev

データフレームの欠落している行を埋める

分類Dev

あるデータフレームから別のデータフレームで欠落している値を検索する正しい方法

分類Dev

データフレームから欠落している行をゼロで埋めます

分類Dev

null値のデータフレームに欠落している月を追加する

分類Dev

データフレームからダミー変数の行列を作成します。欠落している値には `NA`を使用します

分類Dev

データフレーム列の欠落している値をRの列中央値で埋めます

分類Dev

時系列データの欠落している行をPythonのパンダデータフレームに追加する方法

分類Dev

欠落しているすべての日付データフレームの前日の行を複製する

分類Dev

欠落しているデータを、別のデータフレーム内の一致する行の値に置き換えます

分類Dev

欠落している年をデータフレームに追加します(再形成)

分類Dev

データフレームpythonの特定の場所から値が欠落している行を削除します

Related 関連記事

  1. 1

    欠落している行の明示的な表現をデータフレームに追加しますか?

  2. 2

    データが欠落しているデータフレームに値が「0」の行を追加する

  3. 3

    R または Python のデータ フレームに欠落している秒を追加する

  4. 4

    欠落している日時値に基づいて空のデータフレーム行を追加する

  5. 5

    パンダは範囲からデータフレームに欠落している週を追加します

  6. 6

    Rのデータフレームで値が欠落している行の割合を決定します

  7. 7

    データフレームの欠落している行を修復する

  8. 8

    データフレームに欠落しているデータの行を作成する方法

  9. 9

    データフレーム内の欠落している値のみを別のデータフレームからの値で埋めます

  10. 10

    データが欠落しているデータフレームの行に適用を使用し、行ごとに関数を変更します-r

  11. 11

    欠落している行と補間された値をRのデータフレームに追加するにはどうすればよいですか?

  12. 12

    Rデータフレームの欠落している行を埋めます

  13. 13

    データフレームに欠落している日を追加する

  14. 14

    観測値が欠落している場合は、データフレームに行を追加します

  15. 15

    データフレームで欠落している日付をどのように管理しますか?

  16. 16

    R:値が欠落している列をデータフレームに追加します

  17. 17

    パンダの状態に基づいて、あるデータフレームから別のデータフレームに欠落している行を追加するにはどうすればよいですか?

  18. 18

    欠落している行を追加し、現在のデータフレームに基づいて列の値をゼロに設定します

  19. 19

    データフレームの欠落している行を埋める

  20. 20

    あるデータフレームから別のデータフレームで欠落している値を検索する正しい方法

  21. 21

    データフレームから欠落している行をゼロで埋めます

  22. 22

    null値のデータフレームに欠落している月を追加する

  23. 23

    データフレームからダミー変数の行列を作成します。欠落している値には `NA`を使用します

  24. 24

    データフレーム列の欠落している値をRの列中央値で埋めます

  25. 25

    時系列データの欠落している行をPythonのパンダデータフレームに追加する方法

  26. 26

    欠落しているすべての日付データフレームの前日の行を複製する

  27. 27

    欠落しているデータを、別のデータフレーム内の一致する行の値に置き換えます

  28. 28

    欠落している年をデータフレームに追加します(再形成)

  29. 29

    データフレームpythonの特定の場所から値が欠落している行を削除します

ホットタグ

アーカイブ