sci-kitでの正規化はlinear_modelsを学習します

mgoldwasser

Trueの線形モデルのいずれかで正規化パラメーターがに設定されている場合sklearn.linear_model、スコアステップ中に正規化が適用されますか?

例えば:

from sklearn import linear_model
from sklearn.datasets import load_boston

a = load_boston()

l = linear_model.ElasticNet(normalize=False)
l.fit(a["data"][:400], a["target"][:400])
print l.score(a["data"][400:], a["target"][400:])
# 0.24192774524694727

l = linear_model.ElasticNet(normalize=True)
l.fit(a["data"][:400], a["target"][:400])
print l.score(a["data"][400:], a["target"][400:])
# -2.6177006348389167

この場合、を設定すると予測力が低​​下しnormalize=Trueます。これが単にscore正規化を適用していない関数のアーティファクトなのか、正規化された値によってmodelパフォーマンスが低下したのかはわかりません

jakevdp

正規化は、実際に適合データと予測データの両方に適用されます。このように異なる結果が表示される理由は、Boston HousePriceデータセットの列の範囲が大きく異なるためです。

>>> from sklearn.datasets import load_boston
>>> boston = load_boston()
>>> boston.data.std(0)
array([  8.58828355e+00,   2.32993957e+01,   6.85357058e+00,
         2.53742935e-01,   1.15763115e-01,   7.01922514e-01,
         2.81210326e+01,   2.10362836e+00,   8.69865112e+00,
         1.68370495e+02,   2.16280519e+00,   9.12046075e+01,
         7.13400164e+00])

これは、ElasticNetの正則化項が、正規化されたデータと正規化されていないデータに対して非常に異なる影響を与えることを意味します。これが、結果が異なる理由です。これは、正則化の強さ(alpha)を非常に小さい数に設定することで確認できます1E-8この場合、正則化はほとんど効果がなく、正規化は予測結果に影響を与えなくなります。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

sci-kitは凝集的クラスタリングエラーを学習します

分類Dev

sci-kit学習ライブラリのアルゴリズムのパラメータで最適化はどのように行われますか?

分類Dev

最近傍で異なる形式のKを渡すとエラーが発生します(Sciキット学習)

分類Dev

GridSearchCVを使用してデータをトレーニングすると、ValueErrorが発生し、Sci-kitで学習します

分類Dev

Sci-kitは混同行列のラベルを印刷する方法を学びますか?

分類Dev

Sci-kitはpairwise_distancesが不正確であることを学びますか?

分類Dev

Sci-Kit Scaler and Inversion Does Not Yield Identical Numbers?

分類Dev

sci-kit Learn Machine Learningを使用して、回帰で可能な値の間隔を取得します

分類Dev

適合したsci-kitモデルへのSciPy最適化の適用

分類Dev

Python sci-kit学習(メトリック):r2_scoreとExplained_variance_scoreの違い?

分類Dev

sci-kitlearnを使用して数値のみを代入する

分類Dev

Sci-kit LearnKDEの分散が1つ増加

分類Dev

Sci-Kit Learn&Tensorflowを使用したハンズオン機械学習の住宅データセットを再作成しようとすると表示されません

分類Dev

Sci-KitのCountVectorizerを使用して、語彙の正確な単語のみに一致するように入力を変換します

分類Dev

Combining predicted results of Sci-Kit learn classifier with original test set data

分類Dev

Loss/Risk function for sci-kit learn's naive Bayes classifier

分類Dev

sci-kitlearnでのカテゴリ予測変数の使用

分類Dev

Sci-Kit学習分類器の予測結果を元のテストセットデータと組み合わせる

分類Dev

Sci-Kitスカラーと反転は同じ数を生成しませんか?

分類Dev

Pythonで手書き文字認識を行う手順は何ですか?opencvとsciキットを使用して学びますか?

分類Dev

Sci-py統計のt検定はウェルチのt検定です

分類Dev

Sci-Kit Learn:誤って分類されたデータの調査

分類Dev

ロジスティック回帰による予測の作成(Python Sci Kit Learn)

分類Dev

幾何学的オブジェクトのプロット。Sci-lab

分類Dev

SCIが常に0になる理由を知る必要があります

分類Dev

Sci-kit分類のために準備されたデータを使用する

分類Dev

Sci-kit:GridSearchCVを使用するときに、推定量の混同行列を取得する最も簡単な方法は何ですか?

分類Dev

Sci-kitlearn / pythonでの自然なテキストの効果的な分類

分類Dev

sci-kitlearnの単純ベイズ分類器の損失/リスク関数

Related 関連記事

  1. 1

    sci-kitは凝集的クラスタリングエラーを学習します

  2. 2

    sci-kit学習ライブラリのアルゴリズムのパラメータで最適化はどのように行われますか?

  3. 3

    最近傍で異なる形式のKを渡すとエラーが発生します(Sciキット学習)

  4. 4

    GridSearchCVを使用してデータをトレーニングすると、ValueErrorが発生し、Sci-kitで学習します

  5. 5

    Sci-kitは混同行列のラベルを印刷する方法を学びますか?

  6. 6

    Sci-kitはpairwise_distancesが不正確であることを学びますか?

  7. 7

    Sci-Kit Scaler and Inversion Does Not Yield Identical Numbers?

  8. 8

    sci-kit Learn Machine Learningを使用して、回帰で可能な値の間隔を取得します

  9. 9

    適合したsci-kitモデルへのSciPy最適化の適用

  10. 10

    Python sci-kit学習(メトリック):r2_scoreとExplained_variance_scoreの違い?

  11. 11

    sci-kitlearnを使用して数値のみを代入する

  12. 12

    Sci-kit LearnKDEの分散が1つ増加

  13. 13

    Sci-Kit Learn&Tensorflowを使用したハンズオン機械学習の住宅データセットを再作成しようとすると表示されません

  14. 14

    Sci-KitのCountVectorizerを使用して、語彙の正確な単語のみに一致するように入力を変換します

  15. 15

    Combining predicted results of Sci-Kit learn classifier with original test set data

  16. 16

    Loss/Risk function for sci-kit learn's naive Bayes classifier

  17. 17

    sci-kitlearnでのカテゴリ予測変数の使用

  18. 18

    Sci-Kit学習分類器の予測結果を元のテストセットデータと組み合わせる

  19. 19

    Sci-Kitスカラーと反転は同じ数を生成しませんか?

  20. 20

    Pythonで手書き文字認識を行う手順は何ですか?opencvとsciキットを使用して学びますか?

  21. 21

    Sci-py統計のt検定はウェルチのt検定です

  22. 22

    Sci-Kit Learn:誤って分類されたデータの調査

  23. 23

    ロジスティック回帰による予測の作成(Python Sci Kit Learn)

  24. 24

    幾何学的オブジェクトのプロット。Sci-lab

  25. 25

    SCIが常に0になる理由を知る必要があります

  26. 26

    Sci-kit分類のために準備されたデータを使用する

  27. 27

    Sci-kit:GridSearchCVを使用するときに、推定量の混同行列を取得する最も簡単な方法は何ですか?

  28. 28

    Sci-kitlearn / pythonでの自然なテキストの効果的な分類

  29. 29

    sci-kitlearnの単純ベイズ分類器の損失/リスク関数

ホットタグ

アーカイブ