我在这篇文章中有两个问题:
第一的:
我正在使用以下数据集。
https://www.dropbox.com/s/u8lbehhqokkasic/bank-full.csv?dl=0
我想将 Job 列转换为类别/数字,以便对其实施算法。这可能是愚蠢的问题,但我是新手。对不起。
到目前为止,这是我的代码:
df = pd.read_csv('bank-full.csv', sep='\s*,\s*',
header=0, encoding='ascii', engine='python')
print (df["job"])
df["job"]=df["job"].astype('category')
df["job"]= df["job"].cat.codes
但我收到以下错误。
KeyError: 'job'
第二:
我不确定我在哪里做错了。我必须先定义标题吗?由于使用 ; 分隔数据;它可能看不到列标题。我试图用 next() 方法定义它,但也没有用。它给出了同样的错误
KeyError: 'job'
根据df.head()
您在上图中共享的值,很明显 CSV 文件没有按预期进行解析。为分隔符参数提供分号值,如下所示:
sep=';'
如果您需要有关在 Pandas 中解析 CSV 文件(实际上不是逗号分隔的)的更多详细信息,请参阅这篇文章。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句