我正在编写一个读取csv文件并使用pandas库创建数据透视表的脚本。
我一直收到一个错误('utf-8'编解码器无法解码位置6:无效的连续字节中的字节0xf1),该错误已链接回csv文件中名称之一中的'ñ'用法。
我已经搜索了数小时,试图找到一种解决方法。我尝试在我的pandas.read_csv中包括编码类型,但没有运气。
这是我的代码:
df = pandas.read_csv(
os.path.join(wd,'Birthday_%s.csv' % datesuffix),
encoding='utf-8')
pivot = pandas.pivot_table(df,
index=['ClientID','ClientName','Branch'],
values=['EmailAddress'],
aggfunc='count',
margins=True)
pivotlocation = os.path.join(wd,'BirthdayPivot.csv')
pivot.to_csv(pivotlocation)
任何帮助将不胜感激。
编辑:这是引起问题的问题所在的行。
ClientID | ClientName | Branch | Name | EmailAddress
5555 | ExampleClient | ExampleBranch | Avendaño | [email protected]
似乎是造成此问题的原因是名称列(包含“Avendaño”)。
正确的编码可能是“ latin-1”,因此您可能需要考虑:
df = pandas.read_csv(
os.path.join(wd,'Birthday_%s.csv' % datesuffix),
encoding='latin-1')
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句