このデータをクラスター化するには、どのアルゴリズムとハイパーパラメーターのどの組み合わせが最適ですか?

rrm_2016

私は非線形クラスタリングアルゴリズムについて学んでいて、この2Dグラフに出くわしました。どのクラスタリングアルゴリズムとハイパーパラメーターの組み合わせがこのデータをうまくクラスター化するのか疑問に思いました。

プロット

人間がこれらの5つのスパイクをクラスター化するのと同じように。アルゴリズムにそれを実行させたい。KMeansを試しましたが、水平方向または垂直方向にしかクラスタリングされていませんでした。GMMを使い始めましたが、目的のクラスタリングに適したハイパーパラメーターを取得できませんでした。

QUIT--Anony-Mousse

それが機能しない場合は、常に最初に前処理を改善するようにしてください。k-meansなどのアルゴリズムはスケーリングに非常に敏感であるため、慎重に選択する必要があります。

ここでは、GMMが明らかに最初の選択肢です。さまざまなツールを試す価値があるかもしれません。RのMclustは非常に遅いです。SklearnのGMMは不安定な場合があります。ELKIを使い始めるのは少し難しいですが、そのEMは通常私に最良の結果をもたらしました。

GMMとは別に、相関クラスタリングを試す価値があると思われますこれらのアルゴリズムは、クラスターが存在する多様体(線など)があることを前提としています。例としては、ORCLUS、LMCLUS、CASH、4Cなどがあります。しかし、私の意見では、これらは主に合成玩具データで機能します。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

sci-kit学習ライブラリのアルゴリズムのパラメータで最適化はどのように行われますか?

分類Dev

クラスターの数が不明でノイズがない場合、どのクラスタリングアルゴリズムが最適ですか?

分類Dev

どのように私はPythonのデータフレームのインデックスを組み合わせることができますか?

分類Dev

複数の同じ機能クラス(コントローラー)を、データオブジェクトをパラメーターとして受け取る1つに組み合わせるにはどうすればよいですか?

分類Dev

パターンとグラデーションを1つのパスに組み合わせるにはどうすればよいですか?

分類Dev

このデータをクラスター化するための最良のアルゴリズムは何ですか

分類Dev

データフレーム内の2つの変数の組み合わせに基づいてハッシュアルゴリズムを作成するにはどうすればよいですか?

分類Dev

Javaのパラメーターとしてアルゴリズムを渡すことはできますか?

分類Dev

C#で最後のパラメーターのみを「パラメータータイプ」にすることができるのはなぜですか

分類Dev

値渡しパラメーターがコンパイラーのコード最適化を容易にすることが多いのはなぜですか?

分類Dev

パンダデータフレームで組み合わせの組み合わせを取得するにはどうすればよいですか?

分類Dev

C ++コンパイラの最適化は、スコープが終了する前に未使用のデータ構造をクリアできますか?

分類Dev

パンダ-インデックスからのペアワイズの組み合わせでデータフレームを正方行列に変換します

分類Dev

Djangoは予期せず、アルゴリズムパラメータではなく、パスワードハッシュのみを保存します

分類Dev

制約の組み合わせをパラメーター パックに適用する

分類Dev

ldaのアルゴリズムに最適なソリューションをパラメーターで定義する方法は?

分類Dev

私は、コントローラへの単一の引数にリクエストで複数のパラメータを組み合わせることができますか?

分類Dev

この組み合わせアルゴリズムのパフォーマンスを向上させますか?

分類Dev

cudaドライバーAPIとcudaランタイムAPIをどのように組み合わせることができますか?

分類Dev

異なるパラメータを持つ複数のsklearnアルゴリズムを複数のデータフレームに適用する方法は?

分類Dev

私はRabbitMQのを使用してカスタムアルゴリズムの代わりに、ラウンドロビンでメッセージをディスパッチすることはできますか?

分類Dev

特定のアルゴリズムを使用して、1とそのパラメーターの間の整数を出力するように、この関数を修正するにはどうすればよいですか?

分類Dev

ValueErrorを修正する方法:分類メトリックは、モデルのマルチクラスターゲットとマルチラベルインジケーターターゲットの組み合わせを処理できませんか?

分類Dev

CakePHPハッシュアルゴリズムとSALTを使用してMySQLfor CakePHP Webサイトデータベースで暗号化されたパスワードを生成するためのSQLステートメントを作成するにはどうすればよいですか?

分類Dev

選択とフィルターの組み合わせMS-GraphクエリパラメーターがsignInActivity / lastSignInDateTimeで期待どおりに機能しない

分類Dev

ギジェットがパラメーターの組み合わせによって識別される場合、DB内のどこにでもすべてのパラメーターを含める必要がありますか、それとも1回だけにする必要がありますか?

分類Dev

数値データとカテゴリデータがある場合、クラスタリングの問題に使用するアルゴリズムはどれですか?

分類Dev

Rの特定のパラメーターに基づいて行を組み合わせるにはどうすればよいですか?

分類Dev

これはDBSCANアルゴリズムの予想される動作ですか(2つの同一のデータサンプルが同じクラスターに適合していません)?

Related 関連記事

  1. 1

    sci-kit学習ライブラリのアルゴリズムのパラメータで最適化はどのように行われますか?

  2. 2

    クラスターの数が不明でノイズがない場合、どのクラスタリングアルゴリズムが最適ですか?

  3. 3

    どのように私はPythonのデータフレームのインデックスを組み合わせることができますか?

  4. 4

    複数の同じ機能クラス(コントローラー)を、データオブジェクトをパラメーターとして受け取る1つに組み合わせるにはどうすればよいですか?

  5. 5

    パターンとグラデーションを1つのパスに組み合わせるにはどうすればよいですか?

  6. 6

    このデータをクラスター化するための最良のアルゴリズムは何ですか

  7. 7

    データフレーム内の2つの変数の組み合わせに基づいてハッシュアルゴリズムを作成するにはどうすればよいですか?

  8. 8

    Javaのパラメーターとしてアルゴリズムを渡すことはできますか?

  9. 9

    C#で最後のパラメーターのみを「パラメータータイプ」にすることができるのはなぜですか

  10. 10

    値渡しパラメーターがコンパイラーのコード最適化を容易にすることが多いのはなぜですか?

  11. 11

    パンダデータフレームで組み合わせの組み合わせを取得するにはどうすればよいですか?

  12. 12

    C ++コンパイラの最適化は、スコープが終了する前に未使用のデータ構造をクリアできますか?

  13. 13

    パンダ-インデックスからのペアワイズの組み合わせでデータフレームを正方行列に変換します

  14. 14

    Djangoは予期せず、アルゴリズムパラメータではなく、パスワードハッシュのみを保存します

  15. 15

    制約の組み合わせをパラメーター パックに適用する

  16. 16

    ldaのアルゴリズムに最適なソリューションをパラメーターで定義する方法は?

  17. 17

    私は、コントローラへの単一の引数にリクエストで複数のパラメータを組み合わせることができますか?

  18. 18

    この組み合わせアルゴリズムのパフォーマンスを向上させますか?

  19. 19

    cudaドライバーAPIとcudaランタイムAPIをどのように組み合わせることができますか?

  20. 20

    異なるパラメータを持つ複数のsklearnアルゴリズムを複数のデータフレームに適用する方法は?

  21. 21

    私はRabbitMQのを使用してカスタムアルゴリズムの代わりに、ラウンドロビンでメッセージをディスパッチすることはできますか?

  22. 22

    特定のアルゴリズムを使用して、1とそのパラメーターの間の整数を出力するように、この関数を修正するにはどうすればよいですか?

  23. 23

    ValueErrorを修正する方法:分類メトリックは、モデルのマルチクラスターゲットとマルチラベルインジケーターターゲットの組み合わせを処理できませんか?

  24. 24

    CakePHPハッシュアルゴリズムとSALTを使用してMySQLfor CakePHP Webサイトデータベースで暗号化されたパスワードを生成するためのSQLステートメントを作成するにはどうすればよいですか?

  25. 25

    選択とフィルターの組み合わせMS-GraphクエリパラメーターがsignInActivity / lastSignInDateTimeで期待どおりに機能しない

  26. 26

    ギジェットがパラメーターの組み合わせによって識別される場合、DB内のどこにでもすべてのパラメーターを含める必要がありますか、それとも1回だけにする必要がありますか?

  27. 27

    数値データとカテゴリデータがある場合、クラスタリングの問題に使用するアルゴリズムはどれですか?

  28. 28

    Rの特定のパラメーターに基づいて行を組み合わせるにはどうすればよいですか?

  29. 29

    これはDBSCANアルゴリズムの予想される動作ですか(2つの同一のデータサンプルが同じクラスターに適合していません)?

ホットタグ

アーカイブ