複数のデータ型で大規模なデータフレームを再構築する

Ztarrk

データ(xlsxファイル)を正しい形式で取得するのに苦労しています。私の元のデータベースは次のとおりです。

   patient when    age weight height watchID dateFrom           
   <chr>   <chr> <dbl> <dbl>   <dbl>   <dbl> <dttm>             
 1 T01     pre      82 83        174    2788 2017-07-24
 2 T02     pre      81 80        166    7309 2017-07-22 
 3 T02     post     67 91        163    7309 2017-10-26 
 4 T03     pre      68 91        172    5066 2017-07-26 
 5 T03     post     68 91        172    7220 2017-10-24 

「when」列に基づいて患者IDが1つしかない幅広いデータベースを取得したいと思います。しかし、私がそれを再形成しようとすると、私はついに「dcast」関数でこれに到達します。

   patient age_post age_pre weight_post weight_pre height_post height_pre
   <chr>      <int>   <int>       <int>      <int>       <int>      <int>
 1 T01            0       1           0          1           0          1
 2 T02            1       1           1          1           1          1
 3 T03            1       1           1          1           1          1
 4 T04            0       1           0          1           0          1
 5 T05            1       0           1          0           1          0

どういうわけか、すべての変数を1と0に変更します。元の列に「pre」と「post」が付加された、異なる変数タイプの同様のデータベースを取得するにはどうすればよいですか。

これは私のコードです(「HW」は上記の元のデータセットです):

mdata <- melt(HW, id=c("patient","when"))
mdata$value <- as.numeric(as.character(mdata$value)) #I added this line to convert the column to numeric but it doesn't help
mdata2 <- dcast(mdata, patient~variable+when)

私もそれを試しました:

mdata <- melt(HW, id=c("patient","when"))
mdata3 <- reshape(mdata, idvar='patient', timevar='when', direction='wide')

しかし、私はこれを取得します:

   patient variable.pre value.pre variable.post value.post
   <chr>   <fct>        <chr>     <fct>         <chr>     
 1 T01     age          82        NA            NA        
 2 T02     age          81        age           67        
 3 T03     age          68        age           68        
 4 T04     age          81        NA            NA        
 5 T05     NA           NA        age           87 

他の変数なし。

前もって感謝します。

Deter11

これはあなたが望むことをしますか?

library(tidyr)
df <- tibble(patient = c("T01","T02","T02","T03","T03"),
             when = c("pre","pre","post","pre","post"),
             age = c(82,81,67,68,68),
             weight = c(83,80,91,91,91),
             height = c(174,166,163,172,172),
             watchid = c(2788,7309,7309,5066,7220),
             datefrom = c("2017-07-24","2017-07-22","2017-10-26",
                          "2017-07-26","2017-10-24"))

df %>%
  pivot_wider(names_from = when,
              values_from = c(age,weight,height,watchid,datefrom))

A tibble: 3 x 11
  patient age_pre age_post weight_pre weight_post height_pre height_post watchid_pre watchid_post
  <chr>     <dbl>    <dbl>      <dbl>       <dbl>      <dbl>       <dbl>       <dbl>        <dbl>
1 T01          82       NA         83          NA        174          NA        2788           NA
2 T02          81       67         80          91        166         163        7309         7309
3 T03          68       68         91          91        172         172        5066         7220

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

複雑で大規模なデータフレームの再構築

分類Dev

大規模で大規模なSparkデータフレームに参加する

分類Dev

複数の時系列列を大規模なデータフレームの要素に強制する

分類Dev

大規模なデータフレームを列名に基づいて複数のデータフレームに分割する

分類Dev

Rでデータフレームを再構築する

分類Dev

大規模なデータセットの外れ値のみのデータフレームを作成する

分類Dev

大規模なデータセットのデータフレームの列を要約する

分類Dev

データフレームの辞書を再構築する効率的な方法

分類Dev

大規模で巨大なSparkデータフレームに参加する

分類Dev

パンダデータフレームを再構築する

分類Dev

大きなデータフレームを複数の小さなデータフレームに分割する

分類Dev

(大規模な)パンダのデータフレームをスクロールする方法は?

分類Dev

R-割り当てなしで複数の列を持つデータフレームを構築します

分類Dev

r データ フレームで ID が重複する列の再構築/スタック

分類Dev

大規模なデータフレームから特定の値を抽出する最善の方法

分類Dev

リストを大規模な辞書からデータフレームに変換する際の問題

分類Dev

大規模なデータフレームの列全体に条件を適用するパンダ

分類Dev

優れた大規模なデータフレームの辞書を書く

分類Dev

パンダのデータフレームを再構築する

分類Dev

Hiveで複雑なデータ型を構築する

分類Dev

大規模なPythonデータフレームからの単語数に基づいてキーワードを削除する

分類Dev

Pandasデータフレームでの列名の再構築

分類Dev

Haskellで大規模なデータ構造をコンパイルする

分類Dev

警告:非常に大きなデータフレームの列に複数のデータ型があります

分類Dev

大規模なデータフレームからパンダの列を(最初と最後から)削除する最も効率的な方法は何ですか?

分類Dev

パンダでデータフレームを構築する

分類Dev

pandas:> 1 ndimCategoricalでデータフレームを構築する

分類Dev

大規模なデータセット内の重複を特定する

分類Dev

大規模なデータフレームで移動するサブセット内の最大値を見つける

Related 関連記事

  1. 1

    複雑で大規模なデータフレームの再構築

  2. 2

    大規模で大規模なSparkデータフレームに参加する

  3. 3

    複数の時系列列を大規模なデータフレームの要素に強制する

  4. 4

    大規模なデータフレームを列名に基づいて複数のデータフレームに分割する

  5. 5

    Rでデータフレームを再構築する

  6. 6

    大規模なデータセットの外れ値のみのデータフレームを作成する

  7. 7

    大規模なデータセットのデータフレームの列を要約する

  8. 8

    データフレームの辞書を再構築する効率的な方法

  9. 9

    大規模で巨大なSparkデータフレームに参加する

  10. 10

    パンダデータフレームを再構築する

  11. 11

    大きなデータフレームを複数の小さなデータフレームに分割する

  12. 12

    (大規模な)パンダのデータフレームをスクロールする方法は?

  13. 13

    R-割り当てなしで複数の列を持つデータフレームを構築します

  14. 14

    r データ フレームで ID が重複する列の再構築/スタック

  15. 15

    大規模なデータフレームから特定の値を抽出する最善の方法

  16. 16

    リストを大規模な辞書からデータフレームに変換する際の問題

  17. 17

    大規模なデータフレームの列全体に条件を適用するパンダ

  18. 18

    優れた大規模なデータフレームの辞書を書く

  19. 19

    パンダのデータフレームを再構築する

  20. 20

    Hiveで複雑なデータ型を構築する

  21. 21

    大規模なPythonデータフレームからの単語数に基づいてキーワードを削除する

  22. 22

    Pandasデータフレームでの列名の再構築

  23. 23

    Haskellで大規模なデータ構造をコンパイルする

  24. 24

    警告:非常に大きなデータフレームの列に複数のデータ型があります

  25. 25

    大規模なデータフレームからパンダの列を(最初と最後から)削除する最も効率的な方法は何ですか?

  26. 26

    パンダでデータフレームを構築する

  27. 27

    pandas:> 1 ndimCategoricalでデータフレームを構築する

  28. 28

    大規模なデータセット内の重複を特定する

  29. 29

    大規模なデータフレームで移動するサブセット内の最大値を見つける

ホットタグ

アーカイブ