使用熊猫读取csv时设置列类型

user2738815 发表于 Dev

用户名

尝试使用以下格式将csv文件读入pandas数据框

dp = pd.read_csv('products.csv', header = 0,  dtype = {'name': str,'review': str,
                                                      'rating': int,'word_count': dict}, engine = 'c')
print dp.shape
for col in dp.columns:
    print 'column', col,':', type(col[0])
print type(dp['rating'][0])
dp.head(3)

这是输出：

(183531, 4)
column name : <type 'str'>
column review : <type 'str'>
column rating : <type 'str'>
column word_count : <type 'str'>
<type 'numpy.int64'>

我可以理解，大熊猫可能会发现很难在给定this和this的情况下将字典的字符串表示形式转换成字典。但是如何将“ rating”列的内容同时设置为str和numpy.int64？

顺便说一句，未指定引擎或标头之类的调整不会更改任何内容。

谢谢并恭祝安康

博维尔上校

在循环中，您正在执行以下操作：

for col in dp.columns:
    print 'column', col,':', type(col[0])

并且您正确地看到str了随处可见的输出，因为col[0]它是列名称的首字母，即字符串。

例如，如果运行此循环：

for col in dp.columns:
    print 'column', col,':', col[0]

您将看到每个列名称的字符串的第一个字母被打印出来-这就是事实col[0]。

您的循环仅循环访问列名，而不循环访问序列数据。

您真正想要的是在循环中检查每一列数据的类型（而不是其标题或标题的一部分）。

因此，请改为执行此操作以获取列数据（非标题数据）的类型：

for col in dp.columns:
    print 'column', col,':', type(dp[col][0])

这类似于您分别打印rating列的类型时所做的操作。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-26

我来说两句

0条评论

登录后参与评论

上一篇：编译后Visual Studio冻结。当我尝试启动应用程序时，资源管理器也是如此

来自分类Dev

使用熊猫从csv读取到DataFrame时，在转换空值后设置数据类型

来自分类Dev

Python：在使用熊猫读取 CSV 文件时替换值

来自分类Dev

从CSV文件读取时如何更改列的数据类型

来自分类Dev

读取csv文件熊猫时提供列名

来自分类Dev

熊猫：读取CSV时出现错误错误

来自分类Dev

使用熊猫导出csv时指定第一列

来自分类Dev

当日期和时间在单独的列中时，将数据从csv读取到熊猫

来自分类Dev

当日期和时间在单独的列中时，将数据从csv读取到熊猫

来自分类Dev

当日期和时间在单独的列中时，将数据从csv读取到熊猫中

来自分类Dev

使用熊猫在for循环中读取csv

来自分类Dev

使用熊猫从zip读取特定的csv文件

来自分类Dev

在使用熊猫从CSV读取整数时，如何优雅地回退到“ NaN”值？

来自分类Dev

使用熊猫read_csv读取此制表符分隔的文件时，行丢失

来自分类Dev

使用熊猫读取csv时获得坏行/错误的数量（error_bad_lines）

来自分类Dev

熊猫读取csv-在使用空格分隔符时识别引号中的条目？

来自分类Dev

使用熊猫从CSV读取数据时如何忽略具有相同索引的多个条目

来自分类Dev

使用熊猫读取带有时间戳列的csv

来自分类Dev

使用熊猫读取csv文件，其中的列由不同数量的空格和逗号分隔

来自分类Dev

使用熊猫读取csv文件，其中的列由不同数量的空格和逗号分隔

来自分类Dev

读取CSV文件时pandas多索引列标题更改类型

来自分类Dev

熊猫-使用列计算值时，当列满足条件时将值设置为0

来自分类Dev

在执行csv读取时将熊猫数据帧头移到

来自分类Dev

熊猫在读取CSV时重命名列

来自分类Dev

尝试通过熊猫读取csv时遇到问题？

来自分类Dev

读取CSV文件时如何跳过列？

来自分类Dev

熊猫将csv dateint列读取到datetime

来自分类Dev

使用熊猫更改列数据类型

来自分类Dev

在熊猫中使用to_csv时删除一些列

来自分类Dev

如何使用python熊猫读取文件名并将名称附加到csv文件中的新列？

Related 相关文章

文章