グリッド検索後のわずかな改善

追放者

バスのスケジュールに関するデータセットで分類の目的でいくつかのアルゴリズムを実行しています。具体的には、いくつかのランダムフォレストを実行しており、ソースコードの一部は次のとおりです。

# Instantiate random forest
from sklearn.ensemble import RandomForestClassifier
random_forest = RandomForestClassifier()

# K-Fold Cross Validation (for grid search)
inner_cross_validator = StratifiedKFold(n_splits=k_fold, shuffle=True)


from sklearn.model_selection import GridSearchCV

# Define parameters for grid search
number_of_trees = {'n_estimators': [100, 300, 500]}
max_features_per_tree = {'max_features': [0.2, 0.5, 0.8]}
min_samples_split_per_node = {'min_samples_split': [0.2, 0.5, 0.8]}
parameters = {**number_of_trees, **max_features_per_tree, **min_samples_split_per_node}

# Execute grid search and retrieve the best classifier
best_random_forest = GridSearchCV(estimator=random_forest, param_grid=parameters, scoring='average_precision', cv=inner_cross_validator, n_jobs=3)
best_random_forest.fit(X_train, y_train)

ただし、グリッド検索後、精度とリコールはほとんど改善されません。

一般に、過去の他のデータセットでの私の経験では、SkLearnのようなライブラリのデフォルト値と比較して、グリッド検索後のさまざまなメトリックのスコアで5%を超える、またはめったに10%の改善に気づいていません。

分類モデルのパフォーマンスを大幅に向上させるために(機能エンジニアリングの段階の後で)何かを行うことはできますか?

アマンビル

ハイパーパラメータ調整による5%〜10%の増加は、大幅な増加です。GridSearchからの増加よりも大きな増加を期待するべきではありません。

機能エンジニアリング(パフォーマンスの向上の余地が非常に大きい)以外に、次のことを試すことができます。

  1. ランダム検索:定義された範囲内でランダムに選択されたハイパーパラメータ値を検索します。これはhttp://scikit-learn.org/stable/modules/generated/sklearn.model_selection.RandomizedSearchCV.htmlである必要があります

  2. 別のアルゴリズムの使用:現在、RandomForestを使用しています。これは、予測の分散を減らし、パフォーマンスをわずかに向上させるための非常に効果的な方法です。ただし、Gradient Boostingのような他の方法では、パフォーマンスが向上するはずです。

  3. さまざまなアルゴリズムのアンサンブル:これは非常に幅広いトピックであり、パフォーマンスを向上させるためにモデルを組み合わせるさまざまな方法をカバーしています。https://www.analyticsvidhya.com/blog/2018/06/comprehensive-guide-for-ensemble-models/

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

Pythonで相互検証せずにグリッド検索する簡単な方法はありますか?

分類Dev

相互検証によるグリッド検索の背後にある理論

分類Dev

Tcl の座標による効率的なグリッド検索

分類Dev

MySQL-特別な文字の有無にかかわらずレコードを検索します

分類Dev

TypeErrorグリッド検索

分類Dev

anglejuiグリッド検索

分類Dev

postgresqlピリオドの有無にかかわらず、検索語からフィールド内を検索する方法

分類Dev

AUCのグリッド検索検索パラメータ

分類Dev

コードの後で変数を置き換えますか? (これは検索の仕方がわからない種類のトピックです)

分類Dev

グリッドCSSは、適切な(私が思う)フォーマットにもかかわらず検証されません

分類Dev

ランダム検索がグリッド検索よりも優れた結果を表示するのはなぜですか?

分類Dev

Googleコード検索の代わりになりますか?

分類Dev

グリッド検索のすべてのパラメーターの組み合わせ

分類Dev

作成後のマングース検索メソッド

分類Dev

コレクションビューグリッドの最後の行は、同じ幅にもかかわらず異なって表示されます-迅速なiOS

分類Dev

検索後のグリッドビューでのCommandNameの編集でエラーが発生しました

分類Dev

欠落フィールドの有無にかかわらずレコードを表示するマルチフィールド検索ボタン(クエリ)

分類Dev

グリッド検索後にXGBRegressor関数からパラメーターを抽出する方法は?

分類Dev

検索アルゴリズムの改善

分類Dev

グリッド検索のH2OResponseErrorグリッドソートを取得

分類Dev

OneVsRestClassifier内の推定器のグリッド検索

分類Dev

グリッド上の座標の検索(2D配列)

分類Dev

必要以上の余分な作業を行わずに、複数のスレッドを持つ配列を検索します

分類Dev

CSSが同じであるにもかかわらず、Firefoxでは検索ボックスの高さが高くなっています

分類Dev

キャレットグリッド検索から最適なntree値を選択する方法は?

分類Dev

$ inの有無にかかわらず、配列を使用してドキュメントを検索しますか?

分類Dev

react-nativeで2つのドラッグ可能なフラットリストの検索を実装する

分類Dev

Solr:キーワード内のスペースの有無にかかわらず検索

分類Dev

不足しているキーの検索に関するこのクエリを改善できますか?(SQLまたはLINQのいずれか)

Related 関連記事

  1. 1

    Pythonで相互検証せずにグリッド検索する簡単な方法はありますか?

  2. 2

    相互検証によるグリッド検索の背後にある理論

  3. 3

    Tcl の座標による効率的なグリッド検索

  4. 4

    MySQL-特別な文字の有無にかかわらずレコードを検索します

  5. 5

    TypeErrorグリッド検索

  6. 6

    anglejuiグリッド検索

  7. 7

    postgresqlピリオドの有無にかかわらず、検索語からフィールド内を検索する方法

  8. 8

    AUCのグリッド検索検索パラメータ

  9. 9

    コードの後で変数を置き換えますか? (これは検索の仕方がわからない種類のトピックです)

  10. 10

    グリッドCSSは、適切な(私が思う)フォーマットにもかかわらず検証されません

  11. 11

    ランダム検索がグリッド検索よりも優れた結果を表示するのはなぜですか?

  12. 12

    Googleコード検索の代わりになりますか?

  13. 13

    グリッド検索のすべてのパラメーターの組み合わせ

  14. 14

    作成後のマングース検索メソッド

  15. 15

    コレクションビューグリッドの最後の行は、同じ幅にもかかわらず異なって表示されます-迅速なiOS

  16. 16

    検索後のグリッドビューでのCommandNameの編集でエラーが発生しました

  17. 17

    欠落フィールドの有無にかかわらずレコードを表示するマルチフィールド検索ボタン(クエリ)

  18. 18

    グリッド検索後にXGBRegressor関数からパラメーターを抽出する方法は?

  19. 19

    検索アルゴリズムの改善

  20. 20

    グリッド検索のH2OResponseErrorグリッドソートを取得

  21. 21

    OneVsRestClassifier内の推定器のグリッド検索

  22. 22

    グリッド上の座標の検索(2D配列)

  23. 23

    必要以上の余分な作業を行わずに、複数のスレッドを持つ配列を検索します

  24. 24

    CSSが同じであるにもかかわらず、Firefoxでは検索ボックスの高さが高くなっています

  25. 25

    キャレットグリッド検索から最適なntree値を選択する方法は?

  26. 26

    $ inの有無にかかわらず、配列を使用してドキュメントを検索しますか?

  27. 27

    react-nativeで2つのドラッグ可能なフラットリストの検索を実装する

  28. 28

    Solr:キーワード内のスペースの有無にかかわらず検索

  29. 29

    不足しているキーの検索に関するこのクエリを改善できますか?(SQLまたはLINQのいずれか)

ホットタグ

アーカイブ