将分类数据转换为数字数据scikit-learn优化

debugcn 发表于 Dev

莫斯塔法·阿尔巴纳（Mostafa Albana）

我有一个包含分类数据的数据集，并使用DictVectorizer将数据转换为数字。

# training data
vect = DictVectorizer(sparse=False)
x =  vect.fit_transform(samples)
# test data
vect.transform(samples)

但是此代码在大型数据集中会造成内存问题，因为当每个类别由许多类型组成时，它会占用过多的内存。

我想要一种解决方案或算法来解决内存成本问题

莫斯塔法·阿尔巴纳（Mostafa Albana）

升级scikit-learn
将稀疏更改为true

vect = DictVectorizer（sparse = False）

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-14

我来说两句

0条评论

登录后参与评论

来自分类Dev

Scikit-Learn中的分类数据转换

来自分类Dev

如何将数据框列的分类值转换为sckikit-learn中的一键编码列？

来自分类Dev

将分类数据从CSV加载到Scikit-Learn以进行机器学习

来自分类Dev

使用scikit-learn生成困难分类数据集

来自分类Dev

使用 Scikit-Learn 使用分类数据制作回归模型

来自分类Dev

将录制的音频转换为数字数据

来自分类Dev

在scikit-learn中将机器学习算法的熊猫数据帧转换为numpy数组是否必须

来自分类Dev

将cvs转换为数据库和图形数据：关于优化的建议

来自分类Dev

scikit-learn 的 .fit() 方法中使用了什么优化算法？

来自分类Dev

将scikit-learn SVM模型转换为LibSVM

来自分类Dev

将scikit-learn SVM模型转换为LibSVM

来自分类Dev

将8位数字转换为char的算法的优化

来自分类Dev

将单例矩阵的pandas数据框转换为数字数据框

来自分类Dev

将逗号分隔的数据框中的列转换为要绘制的数字数据

来自分类Dev

R数据框：将2的列表转换为简单数字数据类型

来自分类Dev

如何将文本和数字数据的混合转换为Apache Spark中的特征数据

来自分类Dev

将文本数据框转换为数字数据框会给出 NA 列表

来自分类Dev

将数字字符串转换为R中的数字数据类型

来自分类Dev

将分类数据转换为数值向量

来自分类Dev

在 scikit-learn 中使用图像数据拟合支持向量分类器会产生错误

来自分类Dev

数据优化

来自分类Dev

如何将文本值转换为Access数字数据类型

来自分类Dev

将顺序数字数据转换为R中的时间格式

来自分类Dev

将字符串转换为数字数据类型并舍入浮点值的函数

来自分类Dev

根据参考范围将数字数据框转换为字符串等效项

来自分类Dev

使用数据透视表时将分类数据与数字数据结合起来

来自分类Dev

将数字转换为数字数组

来自分类Dev

优化将字节转换为兆字节然后按desc排序的数据库查询

来自分类Dev

快速将因子转换为分类数据中的数字

Related 相关文章

文章