使用熊猫读取csv时设置列类型

用户名

尝试使用以下格式csv文件pandas数据框

dp = pd.read_csv('products.csv', header = 0,  dtype = {'name': str,'review': str,
                                                      'rating': int,'word_count': dict}, engine = 'c')
print dp.shape
for col in dp.columns:
    print 'column', col,':', type(col[0])
print type(dp['rating'][0])
dp.head(3)

这是输出:

(183531, 4)
column name : <type 'str'>
column review : <type 'str'>
column rating : <type 'str'>
column word_count : <type 'str'>
<type 'numpy.int64'>

在此处输入图片说明

我可以理解,大熊猫可能会发现很难在给定thisthis的情况下将字典的字符串表示形式转换成字典但是如何将“ rating”列的内容同时设置为str和numpy.int64?

顺便说一句,未指定引擎或标头之类的调整不会更改任何内容。

谢谢并恭祝安康

博维尔上校

在循环中,您正在执行以下操作:

for col in dp.columns:
    print 'column', col,':', type(col[0])

并且您正确地看到str了随处可见的输出,因为col[0]它是列名称的首字母,即字符串。

例如,如果运行此循环:

for col in dp.columns:
    print 'column', col,':', col[0]

您将看到每个列名称的字符串的第一个字母被打印出来-这就是事实col[0]

您的循环仅循环访问列名,而不循环访问序列数据

您真正想要的是在循环中检查每一列数据的类型(而不是其标题或标题的一部分)。

因此,请改为执行此操作以获取列数据(非标题数据)的类型:

for col in dp.columns:
    print 'column', col,':', type(dp[col][0])

这类似于您分别打印rating的类型时所做的操作

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用熊猫从csv读取到DataFrame时,在转换空值后设置数据类型

来自分类Dev

Python:在使用熊猫读取 CSV 文件时替换值

来自分类Dev

从CSV文件读取时如何更改列的数据类型

来自分类Dev

读取csv文件熊猫时提供列名

来自分类Dev

熊猫:读取CSV时出现错误错误

来自分类Dev

使用熊猫导出csv时指定第一列

来自分类Dev

当日期和时间在单独的列中时,将数据从csv读取到熊猫

来自分类Dev

当日期和时间在单独的列中时,将数据从csv读取到熊猫

来自分类Dev

当日期和时间在单独的列中时,将数据从csv读取到熊猫中

来自分类Dev

使用熊猫在for循环中读取csv

来自分类Dev

使用熊猫从zip读取特定的csv文件

来自分类Dev

在使用熊猫从CSV读取整数时,如何优雅地回退到“ NaN”值?

来自分类Dev

使用熊猫read_csv读取此制表符分隔的文件时,行丢失

来自分类Dev

使用熊猫读取csv时获得坏行/错误的数量(error_bad_lines)

来自分类Dev

熊猫读取csv-在使用空格分隔符时识别引号中的条目?

来自分类Dev

使用熊猫从CSV读取数据时如何忽略具有相同索引的多个条目

来自分类Dev

使用熊猫读取带有时间戳列的csv

来自分类Dev

使用熊猫读取csv文件,其中的列由不同数量的空格和逗号分隔

来自分类Dev

使用熊猫读取csv文件,其中的列由不同数量的空格和逗号分隔

来自分类Dev

读取CSV文件时pandas多索引列标题更改类型

来自分类Dev

熊猫-使用列计算值时,当列满足条件时将值设置为0

来自分类Dev

在执行csv读取时将熊猫数据帧头移到

来自分类Dev

熊猫在读取CSV时重命名列

来自分类Dev

尝试通过熊猫读取csv时遇到问题?

来自分类Dev

读取CSV文件时如何跳过列?

来自分类Dev

熊猫将csv dateint列读取到datetime

来自分类Dev

使用熊猫更改列数据类型

来自分类Dev

在熊猫中使用to_csv时删除一些列

来自分类Dev

如何使用python熊猫读取文件名并将名称附加到csv文件中的新列?

Related 相关文章

  1. 1

    使用熊猫从csv读取到DataFrame时,在转换空值后设置数据类型

  2. 2

    Python:在使用熊猫读取 CSV 文件时替换值

  3. 3

    从CSV文件读取时如何更改列的数据类型

  4. 4

    读取csv文件熊猫时提供列名

  5. 5

    熊猫:读取CSV时出现错误错误

  6. 6

    使用熊猫导出csv时指定第一列

  7. 7

    当日期和时间在单独的列中时,将数据从csv读取到熊猫

  8. 8

    当日期和时间在单独的列中时,将数据从csv读取到熊猫

  9. 9

    当日期和时间在单独的列中时,将数据从csv读取到熊猫中

  10. 10

    使用熊猫在for循环中读取csv

  11. 11

    使用熊猫从zip读取特定的csv文件

  12. 12

    在使用熊猫从CSV读取整数时,如何优雅地回退到“ NaN”值?

  13. 13

    使用熊猫read_csv读取此制表符分隔的文件时,行丢失

  14. 14

    使用熊猫读取csv时获得坏行/错误的数量(error_bad_lines)

  15. 15

    熊猫读取csv-在使用空格分隔符时识别引号中的条目?

  16. 16

    使用熊猫从CSV读取数据时如何忽略具有相同索引的多个条目

  17. 17

    使用熊猫读取带有时间戳列的csv

  18. 18

    使用熊猫读取csv文件,其中的列由不同数量的空格和逗号分隔

  19. 19

    使用熊猫读取csv文件,其中的列由不同数量的空格和逗号分隔

  20. 20

    读取CSV文件时pandas多索引列标题更改类型

  21. 21

    熊猫-使用列计算值时,当列满足条件时将值设置为0

  22. 22

    在执行csv读取时将熊猫数据帧头移到

  23. 23

    熊猫在读取CSV时重命名列

  24. 24

    尝试通过熊猫读取csv时遇到问题?

  25. 25

    读取CSV文件时如何跳过列?

  26. 26

    熊猫将csv dateint列读取到datetime

  27. 27

    使用熊猫更改列数据类型

  28. 28

    在熊猫中使用to_csv时删除一些列

  29. 29

    如何使用python熊猫读取文件名并将名称附加到csv文件中的新列?

热门标签

归档