データフレーム内のすべてのカテゴリ変数からダミー変数を作成します

Dmytro Fedoriuk

データフレーム内のすべてのカテゴリ列を1つエンコードする必要があります。私はこのようなものを見つけました:

one_hot <- function(df, key) {
  key_col <- dplyr::select_var(names(df), !! rlang::enquo(key))
  df <- df %>% mutate(.value = 1, .id = seq(n()))
  df <- df %>% tidyr::spread_(key_col, ".value", fill = 0, sep = "_") %>% 
  select(-.id)
}

しかし、すべてのカテゴリ列に適用する方法がわかりません。

keys <- select_if(data, is.character)[-c(1:2)]
tmp <- map(keys, function(names) reduce(data, ~one_hot(.x, keys)))

次のエラーをスローします

エラー:varリストではなく、単一の数値または列名に評価する必要があります

upd:

customers <- data.frame(
  id=c(10, 20, 30, 40, 50),
  gender=c('male', 'female', 'female', 'male', 'female'),
  mood=c('happy', 'sad', 'happy', 'sad','happy'),
  outcome=c(1, 1, 0, 0, 0))
customers

エンコード後

  id gender.female gender.male mood.happy mood.sad outcome
1 10             0           1          1        0       1
2 20             1           0          0        1       1
3 30             1           0          1        0       0
4 40             0           1          0        1       0
5 50             1           0          1        0       0
オリオールプラット

fastDummiesパッケージ付きのワンライナーも

fastDummies::dummy_cols(customers)

  id gender  mood outcome gender_male gender_female mood_happy mood_sad
1 10   male happy       1           1             0          1        0
2 20 female   sad       1           0             1          0        1
3 30 female happy       0           0             1          1        0
4 40   male   sad       0           1             0          0        1
5 50 female happy       0           0             1          1        0

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

Pythonデータフレームのテキスト列の特定の単語からダミー変数とカテゴリ変数を作成します

分類Dev

データフレーム内のすべてのカテゴリ変数の度数分布表を作成するにはどうすればよいですか?

分類Dev

データフレーム内の特定のカテゴリ変数の数を取得します

分類Dev

forループとifステートメントを使用してデータフレーム内の変数から分割表のリストを作成しますか?

分類Dev

データフレームをカテゴリ変数からバイナリ変数のみに再形成します

分類Dev

R lapply():リスト内のすべてのデータフレーム内のすべての列を数値に変更してから、すべての値をパーセンテージに変換します

分類Dev

列の値に基づいてデータフレームのカテゴリ変数を作成する

分類Dev

R:*リストの*カテゴリ変数に基づいてダミー変数を作成します

分類Dev

データフレームからダミー変数の行列を作成します。欠落している値には `NA`を使用します

分類Dev

複数のカテゴリ変数間の均等な表現でデータフレームからリストを生成します

分類Dev

カテゴリ列のdinstict値の数に基づいて、pandasデータフレームからすべての行を削除します

分類Dev

pandasデータフレームのカテゴリデータを使用して変数の名前を変更します

分類Dev

パンダデータフレーム内のCategoricaタイプのすべての列をダミー変数としてエンコードする方法

分類Dev

データフレーム内のカテゴリ変数の変化の分析

分類Dev

パンダのダミーからカテゴリー変数を再構築します

分類Dev

条件を使用して、データフレーム内の既存の変数から新しい変数を作成します

分類Dev

パンダのデータフレームを文字列ベースのカテゴリ列から数値表現に変換する方法

分類Dev

リストの辞書からダミー変数のデータフレームを作成する方法はありますか?

分類Dev

パンダ、すべてのデータフレームを一意のカテゴリ値に変換します

分類Dev

2つの連続変数と2つのレベルを持つ3番目のカテゴリ変数から4つの連続変数を作成するデータフレームを再配置するにはどうすればよいですか?

分類Dev

データフレーム内の数値変数とカテゴリ変数のパーセンテージを計算する

分類Dev

R-データフレーム内のすべての列のデータ型を文字から数値に動的に変換します

分類Dev

データフレーム内のすべてのゼロに数値を追加し、対数変換します

分類Dev

テンプレートから汎用印刷関数を作成して、プリミティブデータ型の変数の値を出力します

分類Dev

データフレーム-ループ内の変数のリストから列名を取得します

分類Dev

特定の値を持つデータフレーム内の各変数のダミーインジケーターを作成します

分類Dev

特定のカテゴリの(すべての)投稿データを変数に取得します

分類Dev

パンダのデータフレームをkerasのカテゴリに変換します

分類Dev

カテゴリ変数に基づいて、データフレームからn行数をRでサブセット化します。

Related 関連記事

  1. 1

    Pythonデータフレームのテキスト列の特定の単語からダミー変数とカテゴリ変数を作成します

  2. 2

    データフレーム内のすべてのカテゴリ変数の度数分布表を作成するにはどうすればよいですか?

  3. 3

    データフレーム内の特定のカテゴリ変数の数を取得します

  4. 4

    forループとifステートメントを使用してデータフレーム内の変数から分割表のリストを作成しますか?

  5. 5

    データフレームをカテゴリ変数からバイナリ変数のみに再形成します

  6. 6

    R lapply():リスト内のすべてのデータフレーム内のすべての列を数値に変更してから、すべての値をパーセンテージに変換します

  7. 7

    列の値に基づいてデータフレームのカテゴリ変数を作成する

  8. 8

    R:*リストの*カテゴリ変数に基づいてダミー変数を作成します

  9. 9

    データフレームからダミー変数の行列を作成します。欠落している値には `NA`を使用します

  10. 10

    複数のカテゴリ変数間の均等な表現でデータフレームからリストを生成します

  11. 11

    カテゴリ列のdinstict値の数に基づいて、pandasデータフレームからすべての行を削除します

  12. 12

    pandasデータフレームのカテゴリデータを使用して変数の名前を変更します

  13. 13

    パンダデータフレーム内のCategoricaタイプのすべての列をダミー変数としてエンコードする方法

  14. 14

    データフレーム内のカテゴリ変数の変化の分析

  15. 15

    パンダのダミーからカテゴリー変数を再構築します

  16. 16

    条件を使用して、データフレーム内の既存の変数から新しい変数を作成します

  17. 17

    パンダのデータフレームを文字列ベースのカテゴリ列から数値表現に変換する方法

  18. 18

    リストの辞書からダミー変数のデータフレームを作成する方法はありますか?

  19. 19

    パンダ、すべてのデータフレームを一意のカテゴリ値に変換します

  20. 20

    2つの連続変数と2つのレベルを持つ3番目のカテゴリ変数から4つの連続変数を作成するデータフレームを再配置するにはどうすればよいですか?

  21. 21

    データフレーム内の数値変数とカテゴリ変数のパーセンテージを計算する

  22. 22

    R-データフレーム内のすべての列のデータ型を文字から数値に動的に変換します

  23. 23

    データフレーム内のすべてのゼロに数値を追加し、対数変換します

  24. 24

    テンプレートから汎用印刷関数を作成して、プリミティブデータ型の変数の値を出力します

  25. 25

    データフレーム-ループ内の変数のリストから列名を取得します

  26. 26

    特定の値を持つデータフレーム内の各変数のダミーインジケーターを作成します

  27. 27

    特定のカテゴリの(すべての)投稿データを変数に取得します

  28. 28

    パンダのデータフレームをkerasのカテゴリに変換します

  29. 29

    カテゴリ変数に基づいて、データフレームからn行数をRでサブセット化します。

ホットタグ

アーカイブ