sci-kitでの正規化はlinear_modelsを学習します

debugcn 投稿 Dev

mgoldwasser

Trueの線形モデルのいずれかで正規化パラメーターがに設定されている場合sklearn.linear_model、スコアステップ中に正規化が適用されますか？

例えば：

from sklearn import linear_model
from sklearn.datasets import load_boston

a = load_boston()

l = linear_model.ElasticNet(normalize=False)
l.fit(a["data"][:400], a["target"][:400])
print l.score(a["data"][400:], a["target"][400:])
# 0.24192774524694727

l = linear_model.ElasticNet(normalize=True)
l.fit(a["data"][:400], a["target"][:400])
print l.score(a["data"][400:], a["target"][400:])
# -2.6177006348389167

この場合、を設定すると予測力が低下しnormalize=Trueます。これが単にscore正規化を適用していない関数のアーティファクトなのか、正規化された値によってmodelパフォーマンスが低下したのかはわかりません。

jakevdp

正規化は、実際に適合データと予測データの両方に適用されます。このように異なる結果が表示される理由は、Boston HousePriceデータセットの列の範囲が大きく異なるためです。

>>> from sklearn.datasets import load_boston
>>> boston = load_boston()
>>> boston.data.std(0)
array([  8.58828355e+00,   2.32993957e+01,   6.85357058e+00,
         2.53742935e-01,   1.15763115e-01,   7.01922514e-01,
         2.81210326e+01,   2.10362836e+00,   8.69865112e+00,
         1.68370495e+02,   2.16280519e+00,   9.12046075e+01,
         7.13400164e+00])

これは、ElasticNetの正則化項が、正規化されたデータと正規化されていないデータに対して非常に異なる影響を与えることを意味します。これが、結果が異なる理由です。これは、正則化の強さ（alpha）を非常に小さい数に設定することで確認できます1E-8。この場合、正則化はほとんど効果がなく、正規化は予測結果に影響を与えなくなります。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-05-28

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

sci-kitでの正規化はlinear_modelsを学習します

sci-kitでの正規化はlinear_modelsを学習します

sci-kitは凝集的クラスタリングエラーを学習します

sci-kit学習ライブラリのアルゴリズムのパラメータで最適化はどのように行われますか？

最近傍で異なる形式のKを渡すとエラーが発生します（Sciキット学習）

GridSearchCVを使用してデータをトレーニングすると、ValueErrorが発生し、Sci-kitで学習します

Sci-kitは混同行列のラベルを印刷する方法を学びますか？

Sci-kitはpairwise_distancesが不正確であることを学びますか？

Sci-Kit Scaler and Inversion Does Not Yield Identical Numbers?

sci-kit Learn Machine Learningを使用して、回帰で可能な値の間隔を取得します

適合したsci-kitモデルへのSciPy最適化の適用

Python sci-kit学習（メトリック）：r2_scoreとExplained_variance_scoreの違い？

sci-kitlearnを使用して数値のみを代入する

Sci-kit LearnKDEの分散が1つ増加

Sci-Kit Learn＆Tensorflowを使用したハンズオン機械学習の住宅データセットを再作成しようとすると表示されません

Sci-KitのCountVectorizerを使用して、語彙の正確な単語のみに一致するように入力を変換します

Combining predicted results of Sci-Kit learn classifier with original test set data

Loss/Risk function for sci-kit learn's naive Bayes classifier

sci-kitlearnでのカテゴリ予測変数の使用

Sci-Kit学習分類器の予測結果を元のテストセットデータと組み合わせる

Sci-Kitスカラーと反転は同じ数を生成しませんか？

Pythonで手書き文字認識を行う手順は何ですか？opencvとsciキットを使用して学びますか？

Sci-py統計のt検定はウェルチのt検定です

Sci-Kit Learn：誤って分類されたデータの調査

ロジスティック回帰による予測の作成（Python Sci Kit Learn）

幾何学的オブジェクトのプロット。Sci-lab

SCIが常に0になる理由を知る必要があります

Sci-kit分類のために準備されたデータを使用する

Sci-kit：GridSearchCVを使用するときに、推定量の混同行列を取得する最も簡単な方法は何ですか？

Sci-kitlearn / pythonでの自然なテキストの効果的な分類

sci-kitlearnの単純ベイズ分類器の損失/リスク関数