我必须使用哪种python编码类型来读取非utf-8字符?

第648章

我必须让我的python脚本读取DNA查询字符串文件并使用它进行搜索。

好吧,文件包含这种类型的字符:

截屏

并且python默认编码无法使用readline()函数读取文件的这一行。引发以下错误:

[...]
File "/usr/lib/python3.4/codecs.py", line 319, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x81 in position 860: invalid start byte

我也尝试过utf_16和ascii,但是没有任何积极的结果。我该怎么读?

元烤面包机

您需要首先弄清楚您必须阅读的文本文件的实际编码,然后将其open与该文件和正确的encoding参数一起使用以打开该文件。钻石?在控制台中只是一个占位符,因此您的默认系统编码与您显示的文件不兼容(反之亦然)。

另外,如果你不关心的“垃圾”的字符,你可以简单'ignore''replace'errors参数。同样,请先查阅文档以获取可用选项。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章