提供UnicodeDecodeError的Python 3 CSV文件:“ utf-8”编解码器在我打印时无法解码字节错误

HLH

我在Python 3中有以下代码,该代码用于打印csv文件中的每一行。

import csv
with open('my_file.csv', 'r', newline='') as csvfile:
    lines = csv.reader(csvfile, delimiter = ',', quotechar = '|')
    for line in lines:
        print(' '.join(line))

但是当我运行它时,它给了我这个错误:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x96 in position 7386: invalid start byte

我查看了csv文件,结果发现,如果我取出单个ñ(小N,顶部有波浪号),则每一行都可以正常打印。

我的问题是,我已经针对类似的问题浏览了许多不同的解决方案,但我仍然不知道如何解决此问题,解码/编码内容等。仅选择数据中的ñ字符是不可行的。

忘了它

我们知道文件包含字节,b'\x96'因为错误消息中已提到该字节

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x96 in position 7386: invalid start byte

现在,我们可以编写一个小脚本来找出b'\x96'解码到的编码是否存在ñ

import pkgutil
import encodings
import os

def all_encodings():
    modnames = set([modname for importer, modname, ispkg in pkgutil.walk_packages(
        path=[os.path.dirname(encodings.__file__)], prefix='')])
    aliases = set(encodings.aliases.aliases.values())
    return modnames.union(aliases)

text = b'\x96'
for enc in all_encodings():
    try:
        msg = text.decode(enc)
    except Exception:
        continue
    if msg == 'ñ':
        print('Decoding {t} with {enc} is {m}'.format(t=text, enc=enc, m=msg))

产生

Decoding b'\x96' with mac_roman is ñ
Decoding b'\x96' with mac_farsi is ñ
Decoding b'\x96' with mac_croatian is ñ
Decoding b'\x96' with mac_arabic is ñ
Decoding b'\x96' with mac_romanian is ñ
Decoding b'\x96' with mac_iceland is ñ
Decoding b'\x96' with mac_turkish is ñ

因此,请尝试更改

with open('my_file.csv', 'r', newline='') as csvfile:

这些编码之一,例如:

with open('my_file.csv', 'r', encoding='mac_roman', newline='') as csvfile:

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

从Python 2移植到Python 3:“ utf-8编解码器无法解码字节”

来自分类Dev

python UnicodeDecodeError:“ utf8”编解码器无法解码字节

来自分类Dev

Python UnicodeDecodeError:“ utf-8”编解码器无法解码字节

来自分类Dev

'utf-8'编解码器无法在Python3.4中解码字节读取文件,但在Python2.7中无法解码

来自分类Dev

UnicodeDecodeError:'utf8'编解码器无法解码字典中的字节

来自分类Dev

'utf8'编解码器无法解码字节0xf3

来自分类Dev

升级pip时出错:UnicodeDecodeError:'utf-8'编解码器无法解码字节

来自分类Dev

Python Pandas to_excel'utf8'编解码器无法解码字节

来自分类Dev

'utf-8'编解码器无法解码字节-Python

来自分类Dev

Python:UnicodeDecodeError:'utf-8'编解码器无法解码字节...无效的连续字节

来自分类Dev

Python UnicodeDecodeError:“ ascii”编解码器无法解码字节0xc3

来自分类Dev

UnicodeDecodeError:'utf-8'编解码器无法解码位置1的字节0xe3:无效的继续字节

来自分类Dev

如何解决UnicodeDecodeError:'utf-8'编解码器无法解码位置3的字节0xa1:无效的起始字节?

来自分类Dev

UnicodeDecodeError:'utf8'编解码器无法解码位置34的字节0xc3:数据意外结束

来自分类Dev

UnicodeDecodeError:'utf8'编解码器无法解码位置34的字节0xc3:数据意外结束

来自分类Dev

Python'utf8'编解码器无法解码位置72的字节0xc3:无效的连续字节

来自分类Dev

将查询结果写入 csv 时,“utf8”编解码器无法解码字节 0x92

来自分类Dev

'utf-8'编解码器无法解码LZ4和Python 3.x上位置12的字节0xf0

来自分类Dev

Python 3:os.walk()文件路径UnicodeEncodeError:'utf-8'编解码器无法编码:不允许代理

来自分类Dev

'utf8'编解码器无法解码字节0xbd CSV文件1/2字符

来自分类Dev

在UnicodeDecodeError压缩的文件上,熊猫read_csv失败:'utf-8'编解码器无法解码位置1的字节0x8b:无效的起始字节

来自分类Dev

UBlox NAV_PVT消息:UnicodeDecodeError:'utf-8'编解码器无法解码字节0xb5

来自分类Dev

python 3 - UnicodeEncodeError: 'charmap' 编解码器无法编码字符(编码所以它在文件中)

来自分类Dev

发生异常:UnicodeDecodeError'utf-8'编解码器无法解码位置的字节0xf1

来自分类Dev

Python 2.7:在写入文件时,“ ascii”编解码器无法编码字符u'\ xe9'错误

来自分类Dev

Python3 utf8编解码器未按预期在Docker ubuntu中解码:trusty

来自分类Dev

python:UnicodeDecodeError:'utf8'编解码器无法解码位置0的字节0xc0:无效的起始字节

来自分类Dev

我使用cmd.exe运行脚本,但出现错误:UnicodeDecodeError:'utf8'编解码器无法解码位置77的字节0xc9:无效的连续字节

来自分类Dev

UnicodeDecodeError'utf-8'编解码器无法解码-使用python shapefile阅读器

Related 相关文章

  1. 1

    从Python 2移植到Python 3:“ utf-8编解码器无法解码字节”

  2. 2

    python UnicodeDecodeError:“ utf8”编解码器无法解码字节

  3. 3

    Python UnicodeDecodeError:“ utf-8”编解码器无法解码字节

  4. 4

    'utf-8'编解码器无法在Python3.4中解码字节读取文件,但在Python2.7中无法解码

  5. 5

    UnicodeDecodeError:'utf8'编解码器无法解码字典中的字节

  6. 6

    'utf8'编解码器无法解码字节0xf3

  7. 7

    升级pip时出错:UnicodeDecodeError:'utf-8'编解码器无法解码字节

  8. 8

    Python Pandas to_excel'utf8'编解码器无法解码字节

  9. 9

    'utf-8'编解码器无法解码字节-Python

  10. 10

    Python:UnicodeDecodeError:'utf-8'编解码器无法解码字节...无效的连续字节

  11. 11

    Python UnicodeDecodeError:“ ascii”编解码器无法解码字节0xc3

  12. 12

    UnicodeDecodeError:'utf-8'编解码器无法解码位置1的字节0xe3:无效的继续字节

  13. 13

    如何解决UnicodeDecodeError:'utf-8'编解码器无法解码位置3的字节0xa1:无效的起始字节?

  14. 14

    UnicodeDecodeError:'utf8'编解码器无法解码位置34的字节0xc3:数据意外结束

  15. 15

    UnicodeDecodeError:'utf8'编解码器无法解码位置34的字节0xc3:数据意外结束

  16. 16

    Python'utf8'编解码器无法解码位置72的字节0xc3:无效的连续字节

  17. 17

    将查询结果写入 csv 时,“utf8”编解码器无法解码字节 0x92

  18. 18

    'utf-8'编解码器无法解码LZ4和Python 3.x上位置12的字节0xf0

  19. 19

    Python 3:os.walk()文件路径UnicodeEncodeError:'utf-8'编解码器无法编码:不允许代理

  20. 20

    'utf8'编解码器无法解码字节0xbd CSV文件1/2字符

  21. 21

    在UnicodeDecodeError压缩的文件上,熊猫read_csv失败:'utf-8'编解码器无法解码位置1的字节0x8b:无效的起始字节

  22. 22

    UBlox NAV_PVT消息:UnicodeDecodeError:'utf-8'编解码器无法解码字节0xb5

  23. 23

    python 3 - UnicodeEncodeError: 'charmap' 编解码器无法编码字符(编码所以它在文件中)

  24. 24

    发生异常:UnicodeDecodeError'utf-8'编解码器无法解码位置的字节0xf1

  25. 25

    Python 2.7:在写入文件时,“ ascii”编解码器无法编码字符u'\ xe9'错误

  26. 26

    Python3 utf8编解码器未按预期在Docker ubuntu中解码:trusty

  27. 27

    python:UnicodeDecodeError:'utf8'编解码器无法解码位置0的字节0xc0:无效的起始字节

  28. 28

    我使用cmd.exe运行脚本,但出现错误:UnicodeDecodeError:'utf8'编解码器无法解码位置77的字节0xc9:无效的连续字节

  29. 29

    UnicodeDecodeError'utf-8'编解码器无法解码-使用python shapefile阅读器

热门标签

归档