PYTHON:使用pandas库将转换后的连续属性(转换为类别)追加到原始数据集

安舒尔·维亚斯(Anshul Vyas)

我是python的新手,我想使用pandas库实现Naive Bayes分类器。为此,我想将所有连续属性转换为分类属性,反之亦然。

我正在使用第一种策略,并且正在尝试将连续属性转换为分类属性,以确保数据的一致性。我使用的数据集是收入数据集,网址为:http : //archive.ics.uci.edu/ml/datasets/Adult

现在我将连续属性转换为使用

pandas.cut(X, bins, labels = None)

方法。我使用等宽合并方法将标签分配给某些合并宽度。(下面的示例)我将其存储在变量cat_age中。现在,我想用分类年龄属性替换数据集中的年龄属性。

cat_age = pd.cut(age, [0, 25, 45, 65, 95], labels = ["Young", "Middle-aged", "Senior", "Old"], right = True , include_lowest = True)

但是我无法替换数据集中的OLD AGE属性值。我尝试使用DataFrame.replace()和DataFrame.assign()方法。

pandas.DataFrame.replace(to_replace='AGE', value = cat_age)   #AGE is the column name in the dataset.

pandas.DataFrame.assign(AGE = cat_age)

但这不能让我为数据集中的列替换或分配不同的值。

The DataFrame.replace() method doesn't give any error but doesn't show the new values in the dataset either.

我确定我在犯一些天真的错误。谁能建议我一种方式,要么将新的AGE列添加为分类值,要么将旧的列替换为这些新值。

old values are of type : int64 while new values are of type : str

这只是1列,我想将其转换为以下数据集中的其他值:每周工作小时数,资本收益,资本损失。任何帮助将不胜感激。

标记图

我无法复制您的问题。您的分配方法看起来非常复杂。我想你只需要说df['new_col'] = Series

无论如何,以下作品...

import pandas as pd

# get data
from urllib import urlopen
page = urlopen('http://archive.ics.uci.edu/ml/machine-learning-databases/adult/adult.data')
df = pd.read_csv(page, header=None, index_col=None)
df.columns = ['age', 'workclass', 'fnlwgt', 'education', 'education-num',
    'marital-status', 'occupation', 'relationship', 'race', 'sex', 'capital-gain',
    'capital-loss', 'hours-per-week', 'native-country', 'income']

# put ages in categories and add as columns to DataFrame
age_bins = [0, 25, 45, 65, 150]
age_labels = ["Young", "Middle-aged", "Senior", "Old"]
df['age_cat'] = pd.cut(df['age'], age_bins, labels=age_labels, 
    right=True, include_lowest=True)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何使用python将原始数据转换为具有行和列的矩阵?

来自分类Dev

将原始数据转换为熊猫数据框?

来自分类Dev

R_将原始数据转换为列数据

来自分类Dev

将通用参数转换为原始数据类型

来自分类Dev

SQL将原始数据转换为汇总表?

来自分类Dev

将通用参数转换为原始数据类型

来自分类Dev

R将原始数据转换为字符

来自分类Dev

如何将图像原始数据转换为图像

来自分类Dev

通过使用原始数据将QImage转换为cv :: Mat

来自分类Dev

使用xargs和管道将标准输出转换为不接受多个单词的原始数据

来自分类Dev

如何使用熊猫将连续数字转换为类别?

来自分类Dev

如何使用熊猫将连续数字转换为类别?

来自分类Dev

如何使用熊猫将连续数字转换为类别?

来自分类Dev

将原始数据中的值错误转换为十六进制字符串?

来自分类Dev

如何将Intel HEX文件转换为原始数据(如内存视图)?

来自分类Dev

C ++:将无符号的long int转换为vector <uint8_t>原始数据

来自分类Dev

将yuv420p原始数据转换为图像opencv

来自分类Dev

将原始数据中的值错误转换为十六进制字符串?

来自分类Dev

如何从频率表转换为R中的原始数据

来自分类Dev

如何从频率表转换为R中的原始数据

来自分类Dev

如何在JavaScript中将原始数据转换为音频

来自分类Dev

将列追加到pandas DataFrame而不更改原始数据

来自分类Dev

如何使用 Pytorch 将增强图像添加到原始数据集?

来自分类Dev

Python PolynomialFeatures 将数据转换成与原始数据不同的形状

来自分类Dev

将SRC属性替换为原始数据

来自分类Dev

熊猫将应用结果转换回原始数据框

来自分类Dev

使用ffmpeg库将原始字节数据转换为h264视频

来自分类Dev

SQL-将数据透视列数据转换为原始数据。不作为表头值

来自分类Dev

使用pandas将类别变量转换为整数

Related 相关文章

  1. 1

    如何使用python将原始数据转换为具有行和列的矩阵?

  2. 2

    将原始数据转换为熊猫数据框?

  3. 3

    R_将原始数据转换为列数据

  4. 4

    将通用参数转换为原始数据类型

  5. 5

    SQL将原始数据转换为汇总表?

  6. 6

    将通用参数转换为原始数据类型

  7. 7

    R将原始数据转换为字符

  8. 8

    如何将图像原始数据转换为图像

  9. 9

    通过使用原始数据将QImage转换为cv :: Mat

  10. 10

    使用xargs和管道将标准输出转换为不接受多个单词的原始数据

  11. 11

    如何使用熊猫将连续数字转换为类别?

  12. 12

    如何使用熊猫将连续数字转换为类别?

  13. 13

    如何使用熊猫将连续数字转换为类别?

  14. 14

    将原始数据中的值错误转换为十六进制字符串?

  15. 15

    如何将Intel HEX文件转换为原始数据(如内存视图)?

  16. 16

    C ++:将无符号的long int转换为vector <uint8_t>原始数据

  17. 17

    将yuv420p原始数据转换为图像opencv

  18. 18

    将原始数据中的值错误转换为十六进制字符串?

  19. 19

    如何从频率表转换为R中的原始数据

  20. 20

    如何从频率表转换为R中的原始数据

  21. 21

    如何在JavaScript中将原始数据转换为音频

  22. 22

    将列追加到pandas DataFrame而不更改原始数据

  23. 23

    如何使用 Pytorch 将增强图像添加到原始数据集?

  24. 24

    Python PolynomialFeatures 将数据转换成与原始数据不同的形状

  25. 25

    将SRC属性替换为原始数据

  26. 26

    熊猫将应用结果转换回原始数据框

  27. 27

    使用ffmpeg库将原始字节数据转换为h264视频

  28. 28

    SQL-将数据透视列数据转换为原始数据。不作为表头值

  29. 29

    使用pandas将类别变量转换为整数

热门标签

归档