R:tidytext :: unnest_tokensを使用して集計するのとは反対です。複数の変数と大文字

DaniCee

この質問のフォローアップとして、反対のタスクaggregate(またはdata.table以下のMWEと同等のタスク)を実行して、df2から開始してdf1を再度取得したいと思います。

ここでのタスクは、df2からdf1を再現することですこのために試しましたがtidytext::unnest_tokens、複数の変数を「分解」する必要がある場合(モデル正しく機能させる方法がわかりません

変数の元の大文字も保持しておくと便利です。

とは異なるエレガントなソリューションtidytext::unnest_tokensが受け入れられます!ありがとう!

これがMWEです。

####MWE
library(data.table)
library(tidytext)
df1 <- data.frame(brand=c(rep('A',4), rep('B',5), rep('C',3), rep('D',2),'E'),
                  model=c('A1','A1','A2','A3','B1','B2','B2','B2','B3','C1','C1','C2','D1','D2','E1'),
                  country=c('P','G','S','S','P','P','F','I','D','S','F','F','G','I','S'),
                  year=c(91,92,93,94,98,95,87,99,00,86,92,92,93,95,99))
df1
dd <- data.table(df1)
df2 <- as.data.frame(dd[, list(models=paste(model, collapse=' /// '),
                               countries=paste(country, collapse=' /// '),
                               years=paste(year, collapse=' /// ')),
                        by=list(brand=brand)])
df2
df1b <- df2 %>% 
  unnest_tokens(model, models, token = "regex", pattern = " /// ")
df1b
####
akrun

使用できます separate_rows

library(tidyverse)
res <- df2 %>% 
         separate_rows(models, countries, years, convert = TRUE) %>%
         rename_all(funs(paste0(names(df1)))) %>% #just to make the column names same as df1
         mutate(year = as.numeric(year)) #convert to numeric to match df1 column type
all.equal(res, df1 %>% 
                  mutate_at(2:3, as.character), check.attributes = FALSE )
#[1] TRUE

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

tidytext:unnest_tokensとtoken = 'ngrams'の問題

分類Dev

Rで複数のダミー変数を1つのカテゴリ変数として収集する

分類Dev

Rで集計を使用して、別の変数の同じ値に対して1つの変数の一意の値を検索する

分類Dev

ネストされたリスト列アプローチとPurrrをTidytext :: Unnest_Tokensと一緒に使用する

分類Dev

r tidytextでのトークン化、アンパサンドのまま

分類Dev

Rを使用して、英数字の単語と大文字が複数ある単語を抽出します

分類Dev

文字列をRの変数として評価する方法は?

分類Dev

R-1つの変数で複数の値を1つの文字列として処理する

分類Dev

rの関数の引数として変数を使用する

分類Dev

データフレームRを使用して複数の月で集計する方法は?

分類Dev

Rの関数の引数として文字列を使用する

分類Dev

複数の列に対してRでDiff()を使用する

分類Dev

文字列を引数として置換を使用してRの関数を編集する

分類Dev

関数内の文字をRの引数として使用するにはどうすればよいですか?

分類Dev

複数の日付と時刻の変数を分割し、Rで時間平均を計算する

分類Dev

tidytext()の問題:unnest_tokensをデータフレームに適用できません

分類Dev

R tidytext関連するバイグラムの一部である場合は単語を削除し、そうでない場合は保持する

分類Dev

forループとpROCパッケージを使用してRの複数のROC曲線を計算します。予測フィールドで使用する変数は何ですか?

分類Dev

R:変数のセットと参照変数の間の絶対差と相対差を計算します

分類Dev

複数の列の名前を変更し、Rでdplyrを使用して収集する

分類Dev

Rを使用してすべての変数を結合することによる値の合計

分類Dev

複数の列を使用するR / ggplot2集計関数

分類Dev

rの因子変数の頻度の大文字と小文字を無視する

分類Dev

rの因子として列内に複数の変数を配置する方法

分類Dev

Rのフィルターとして3番目の変数を使用して2つの変数をプロットすることは可能ですか?

分類Dev

Rでtabylを使用して4つの変数をクロス集計する方法

分類Dev

文字列変数を使用してR関数内で複数の変数情報を渡す

分類Dev

リストの文字列をmediateの変数およびRのlmとして使用するにはどうすればよいですか?

分類Dev

文字列の内容をRの関数の引数として使用する

Related 関連記事

  1. 1

    tidytext:unnest_tokensとtoken = 'ngrams'の問題

  2. 2

    Rで複数のダミー変数を1つのカテゴリ変数として収集する

  3. 3

    Rで集計を使用して、別の変数の同じ値に対して1つの変数の一意の値を検索する

  4. 4

    ネストされたリスト列アプローチとPurrrをTidytext :: Unnest_Tokensと一緒に使用する

  5. 5

    r tidytextでのトークン化、アンパサンドのまま

  6. 6

    Rを使用して、英数字の単語と大文字が複数ある単語を抽出します

  7. 7

    文字列をRの変数として評価する方法は?

  8. 8

    R-1つの変数で複数の値を1つの文字列として処理する

  9. 9

    rの関数の引数として変数を使用する

  10. 10

    データフレームRを使用して複数の月で集計する方法は?

  11. 11

    Rの関数の引数として文字列を使用する

  12. 12

    複数の列に対してRでDiff()を使用する

  13. 13

    文字列を引数として置換を使用してRの関数を編集する

  14. 14

    関数内の文字をRの引数として使用するにはどうすればよいですか?

  15. 15

    複数の日付と時刻の変数を分割し、Rで時間平均を計算する

  16. 16

    tidytext()の問題:unnest_tokensをデータフレームに適用できません

  17. 17

    R tidytext関連するバイグラムの一部である場合は単語を削除し、そうでない場合は保持する

  18. 18

    forループとpROCパッケージを使用してRの複数のROC曲線を計算します。予測フィールドで使用する変数は何ですか?

  19. 19

    R:変数のセットと参照変数の間の絶対差と相対差を計算します

  20. 20

    複数の列の名前を変更し、Rでdplyrを使用して収集する

  21. 21

    Rを使用してすべての変数を結合することによる値の合計

  22. 22

    複数の列を使用するR / ggplot2集計関数

  23. 23

    rの因子変数の頻度の大文字と小文字を無視する

  24. 24

    rの因子として列内に複数の変数を配置する方法

  25. 25

    Rのフィルターとして3番目の変数を使用して2つの変数をプロットすることは可能ですか?

  26. 26

    Rでtabylを使用して4つの変数をクロス集計する方法

  27. 27

    文字列変数を使用してR関数内で複数の変数情報を渡す

  28. 28

    リストの文字列をmediateの変数およびRのlmとして使用するにはどうすればよいですか?

  29. 29

    文字列の内容をRの関数の引数として使用する

ホットタグ

アーカイブ