我有一个从SQL转储中获取的CSV文件,如下所示(从终端使用head file.csv的前几行):
??AANAT,AANAT1576,4
AANAT,AANAT1704,1
AAP,AAP-D-12-00691,8
AAP,AAP-D-12-00834,3
当我使用pd.read_csv('file.csv')命令时,出现错误“ ValueError:没有要从文件解析的列”。
关于如何将CSV文件导入表格并避免错误的任何想法?
阐述问题(在Ed的评论之后)
我试过header = None,skirprows = 1以避免?? (在终端上使用head命令时显示)。
提取的文件路径为http://goo.gl/jyYlIK
因此,??
您看到的字符实际上是不可打印的字符,使用十六进制编辑器查看原始csv文件后,它们实际上是utf-16 little endian \FFEE
,即Byte-Order-Mark。
因此,您所需要做的就是将其作为编码类型传递,并且可以正常读取:
In [46]:
df = pd.read_csv('otherfile.csv', encoding='utf-16', header=None)
df
Out[46]:
0 1 2
0 AANAT AANAT1576 4
1 AANAT AANAT1704 1
2 AAP AAP-D-12-00691 8
3 AAP AAP-D-12-00834 3
4 AAP AAP-D-13-00215 10
5 AAP AAP-D-13-00270 7
6 AAP AAP-D-13-00435 5
7 AAP AAP-D-13-00498 4
8 AAP AAP-D-13-00530 0
9 AAP AAP-D-13-00747 3
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句