kmodesVSワンホットエンコーディング+カテゴリカルデータのkmeans?

クラッシュ

私はいくつかのカテゴリデータをPythonでクラスタリングする可能性を模索しています。私は現在、それぞれ約3〜10レベルの8つの機能を持っています。

私が理解したように、このフレームワークではkmeansとkmodesの両方を使用したワンホットエンコーディングを使用できますが、次元の呪いの問題により、機能/レベルの膨大な組み合わせではkmeansは理想的ではない可能性があります。

これは正しいです?

現時点では、いくつかの数値特徴も柔軟に投入できるため、kmeansルートをたどります。シルエット統計を計算し、クラスターの最適数を評価する方がはるかに簡単なようです。

これは意味がありますか?あるアプローチが他のアプローチよりも優先されるべき状況について何か提案はありますか?

ありがとう

QUIT--Anony-Mousse

カテゴリ属性にkモードアプローチを使用し、連続属性に平均を使用するバリアントもあります。

Kモードには、one-hot + k-meansよりも大きな利点があります。解釈可能です。すべてのクラスターには、プロトタイプに対して1つの明示的なカテゴリ値があります。k-meansの場合、SSQの目的のため、ワンホット変数は値の間にある場合にエラーが最小になります。それは望ましくありません。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

Excelでのカテゴリデータのワンホット(ダミー)エンコーディング

分類Dev

Python PANDAS:ワンホットエンコーディングをカテゴリカルに戻す方法

分類Dev

列内の複数のカテゴリデータを1つのホットエンコーディング

分類Dev

カテゴリが欠落しているワンホットエンコーディング

分類Dev

ワンホットエンコーディング

分類Dev

Python:巨大なデータのワンホットエンコーディング

分類Dev

カテゴリデータセットを使用したワンホットエンコーディング:カテゴリデータのさまざまな値(数が少ない)を処理する方法

分類Dev

パンダワンホットエンコーディング:頻度の低いカテゴリをまとめる

分類Dev

1つのホットエンコーディング単一カテゴリ数値列

分類Dev

1行のいくつかのカテゴリにワンホットエンコーディングを使用する

分類Dev

Theanoでの1-of-k(ワンホット)エンコーディング

分類Dev

ワンホットエンコーディングからのTensorflowマスク

分類Dev

model.matrixを使用したワンホットエンコーディング

分類Dev

ワンホットエンコーディングへのセグメンテーション

分類Dev

ワンホットエンコーディング:リストメンバーシップエラー

分類Dev

rデータセット内の1つの変数のワンホットエンコーディング

分類Dev

ワンホットエンコーディングシングルサンプルパンダ

分類Dev

ワンホットエンコーディングなしでカテゴリ変数を持つ決定木を使用する方法はありますか?

分類Dev

ワンホットエンコーディングのロジスティック回帰

分類Dev

カテゴリカルデータのプロットパンダ/ボケ

分類Dev

sklearn-ワンホットエンコーディング時に欠落データを組み込む方法

分類Dev

それぞれのワンホットエンコードされた列にカテゴリデータの値を入力します

分類Dev

graphvizはワンホットデコードされたカテゴリデータを表示できますか?

分類Dev

パンダの1つのホットエンコーディングで未知のカテゴリ値を処理する方法

分類Dev

複数の同様の列を持つパンダのワンホットエンコーディング

分類Dev

Verilogの1つのホットエンコーディング

分類Dev

ML分類:カテゴリデータのエンコード

分類Dev

パンダでの「ワンホット」エンコーディングの逆転

分類Dev

1つのホットエンコーディング文字

Related 関連記事

  1. 1

    Excelでのカテゴリデータのワンホット(ダミー)エンコーディング

  2. 2

    Python PANDAS:ワンホットエンコーディングをカテゴリカルに戻す方法

  3. 3

    列内の複数のカテゴリデータを1つのホットエンコーディング

  4. 4

    カテゴリが欠落しているワンホットエンコーディング

  5. 5

    ワンホットエンコーディング

  6. 6

    Python:巨大なデータのワンホットエンコーディング

  7. 7

    カテゴリデータセットを使用したワンホットエンコーディング:カテゴリデータのさまざまな値(数が少ない)を処理する方法

  8. 8

    パンダワンホットエンコーディング:頻度の低いカテゴリをまとめる

  9. 9

    1つのホットエンコーディング単一カテゴリ数値列

  10. 10

    1行のいくつかのカテゴリにワンホットエンコーディングを使用する

  11. 11

    Theanoでの1-of-k(ワンホット)エンコーディング

  12. 12

    ワンホットエンコーディングからのTensorflowマスク

  13. 13

    model.matrixを使用したワンホットエンコーディング

  14. 14

    ワンホットエンコーディングへのセグメンテーション

  15. 15

    ワンホットエンコーディング:リストメンバーシップエラー

  16. 16

    rデータセット内の1つの変数のワンホットエンコーディング

  17. 17

    ワンホットエンコーディングシングルサンプルパンダ

  18. 18

    ワンホットエンコーディングなしでカテゴリ変数を持つ決定木を使用する方法はありますか?

  19. 19

    ワンホットエンコーディングのロジスティック回帰

  20. 20

    カテゴリカルデータのプロットパンダ/ボケ

  21. 21

    sklearn-ワンホットエンコーディング時に欠落データを組み込む方法

  22. 22

    それぞれのワンホットエンコードされた列にカテゴリデータの値を入力します

  23. 23

    graphvizはワンホットデコードされたカテゴリデータを表示できますか?

  24. 24

    パンダの1つのホットエンコーディングで未知のカテゴリ値を処理する方法

  25. 25

    複数の同様の列を持つパンダのワンホットエンコーディング

  26. 26

    Verilogの1つのホットエンコーディング

  27. 27

    ML分類:カテゴリデータのエンコード

  28. 28

    パンダでの「ワンホット」エンコーディングの逆転

  29. 29

    1つのホットエンコーディング文字

ホットタグ

アーカイブ