sklearn.preprocessing中的自定义合并?

伊森

我有一个称为size_array的连续变量列表。我一直在这样扩展它们[0, 1]

max_abs_scaler = preprocessing.MinMaxScaler()
scaled = max_abs_scaler.fit_transform(size_array)

有没有办法[-1, 1]在中位数(或百分位数)为0的范围内缩放它们我的数据右偏,因此中位数以上的值分散了很多,而中位数左侧的值没有分散。我试图用这种方法扩展它们:

def using_median():
    if x >= median:
        return (x - median)/(max - median)
    else:
        return (median - x)/(median - min)

但这没有用。还有其他方法sklearn.preprocessing吗?

文卡塔恰兰

我建议使用PowerTransformer()它可以用于偏斜的发行版。

看看这个例子:

from sklearn import preprocessing
import matplotlib.pyplot as plt
import numpy as np

pt = preprocessing.PowerTransformer()
X_lognormal = np.random.RandomState(616)\
    .lognormal(size=(300, 2))

_,ax = plt.subplots(1,2,sharey=True)
ax[0].hist(X_lognormal)

ax[1].hist(pt.fit_transform(X_lognormal))

在此处输入图片说明

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

sklearn中DecisionTreeRegressor的自定义标准

来自分类Dev

sklearn2pmml PMMLPipeline中的自定义函数

来自分类Dev

自定义交叉验证拆分sklearn

来自分类Dev

自定义交叉验证拆分sklearn

来自分类Dev

使用python的sklearn模块和自定义数据集

来自分类Dev

如何在sklearn中编写自定义估算器并在其上使用交叉验证?

来自分类Dev

在Sklearn中的自定义估算器上进行交叉验证的打印语句

来自分类Dev

如何在自定义转换器中访问sklearn列转换器

来自分类Dev

如何在sklearn中编写自定义估算器并在其上使用交叉验证?

来自分类Dev

使用sklearn中的OneVsRestClassifier将自定义的二进制分类调整为多分类

来自分类Dev

如何访问在 sklearn 自定义转换器中为不同超参数选择的新特征的形状

来自分类Dev

在OSX中安装Sklearn

来自分类Dev

改善sklearn中的预测

来自分类Dev

在OSX中安装Sklearn

来自分类Dev

在sklearn管道中合并的多个管道?

来自分类Dev

Sklearn Pipeline-如何在自定义Transformer(而不是Estimator)中继承get_params

来自分类Dev

如何通过sklearn的adaboost方法使用自己的自定义分类器?

来自分类Dev

如何在sklearn中将GridSearchCV与自定义估算器一起使用?

来自分类Dev

如何通过索引自定义sklearn交叉验证迭代器?

来自分类Dev

sklearn管道的自定义转换器,可同时更改X和y

来自分类Dev

(Python-sklearn)如何通过gridsearchcv将参数传递给自定义ModelTransformer类

来自分类Dev

如何将sklearn Pipeline与自定义功能一起使用?

来自分类Dev

在Sklearn管道中使用ColumnTransformer()时发生ValueError-对GloveVectorizer使用Spacy的自定义类

来自分类Dev

sklearn将RandomizedSearchCV与自定义指标结合使用并捕获异常

来自分类Dev

使用自定义指标的sklearn聚类:pairwise_distances抛出错误

来自分类Dev

自定义类(继承TransformerMixin),sklearn2pmml生成PMML文件报编码错误

来自分类Dev

如何在 sklearn 中使用自定义估计器进行交叉验证?

来自分类Dev

如何查看sklearn.preprocessing.PolynomialFeatures的效果?

来自分类Dev

sklearn preprocessing.scale()函数,何时使用?

Related 相关文章

  1. 1

    sklearn中DecisionTreeRegressor的自定义标准

  2. 2

    sklearn2pmml PMMLPipeline中的自定义函数

  3. 3

    自定义交叉验证拆分sklearn

  4. 4

    自定义交叉验证拆分sklearn

  5. 5

    使用python的sklearn模块和自定义数据集

  6. 6

    如何在sklearn中编写自定义估算器并在其上使用交叉验证?

  7. 7

    在Sklearn中的自定义估算器上进行交叉验证的打印语句

  8. 8

    如何在自定义转换器中访问sklearn列转换器

  9. 9

    如何在sklearn中编写自定义估算器并在其上使用交叉验证?

  10. 10

    使用sklearn中的OneVsRestClassifier将自定义的二进制分类调整为多分类

  11. 11

    如何访问在 sklearn 自定义转换器中为不同超参数选择的新特征的形状

  12. 12

    在OSX中安装Sklearn

  13. 13

    改善sklearn中的预测

  14. 14

    在OSX中安装Sklearn

  15. 15

    在sklearn管道中合并的多个管道?

  16. 16

    Sklearn Pipeline-如何在自定义Transformer(而不是Estimator)中继承get_params

  17. 17

    如何通过sklearn的adaboost方法使用自己的自定义分类器?

  18. 18

    如何在sklearn中将GridSearchCV与自定义估算器一起使用?

  19. 19

    如何通过索引自定义sklearn交叉验证迭代器?

  20. 20

    sklearn管道的自定义转换器,可同时更改X和y

  21. 21

    (Python-sklearn)如何通过gridsearchcv将参数传递给自定义ModelTransformer类

  22. 22

    如何将sklearn Pipeline与自定义功能一起使用?

  23. 23

    在Sklearn管道中使用ColumnTransformer()时发生ValueError-对GloveVectorizer使用Spacy的自定义类

  24. 24

    sklearn将RandomizedSearchCV与自定义指标结合使用并捕获异常

  25. 25

    使用自定义指标的sklearn聚类:pairwise_distances抛出错误

  26. 26

    自定义类(继承TransformerMixin),sklearn2pmml生成PMML文件报编码错误

  27. 27

    如何在 sklearn 中使用自定义估计器进行交叉验证?

  28. 28

    如何查看sklearn.preprocessing.PolynomialFeatures的效果?

  29. 29

    sklearn preprocessing.scale()函数,何时使用?

热门标签

归档