错误处理-在熊猫中

富勒顿

我正在编写一个读取csv文件并使用pandas库创建数据透视表的脚本。

我一直收到一个错误('utf-8'编解码器无法解码位置6:无效的连续字节中的字节0xf1),该错误已链接回csv文件中名称之一中的'ñ'用法。

我已经搜索了数小时,试图找到一种解决方法。我尝试在我的pandas.read_csv中包括编码类型,但没有运气。

这是我的代码:

df = pandas.read_csv(
            os.path.join(wd,'Birthday_%s.csv' % datesuffix),
            encoding='utf-8')
pivot = pandas.pivot_table(df,
            index=['ClientID','ClientName','Branch'],
            values=['EmailAddress'],
            aggfunc='count',
            margins=True)
pivotlocation = os.path.join(wd,'BirthdayPivot.csv')
pivot.to_csv(pivotlocation)

任何帮助将不胜感激。

编辑:这是引起问题的问题所在的行。

ClientID | ClientName    | Branch        | Name     | EmailAddress
5555     | ExampleClient | ExampleBranch | Avendaño | [email protected]

似乎是造成此问题的原因是名称列(包含“Avendaño”)。

埃特纳

正确的编码可能是“ latin-1”,因此您可能需要考虑:

df = pandas.read_csv(
            os.path.join(wd,'Birthday_%s.csv' % datesuffix),
            encoding='latin-1')

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章