我必须让我的python脚本读取DNA查询字符串文件并使用它进行搜索。
好吧,文件包含这种类型的字符:
并且python默认编码无法使用readline()函数读取文件的这一行。引发以下错误:
[...]
File "/usr/lib/python3.4/codecs.py", line 319, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x81 in position 860: invalid start byte
我也尝试过utf_16和ascii,但是没有任何积极的结果。我该怎么读?
您需要首先弄清楚您必须阅读的文本文件的实际编码,然后将其open
与该文件和正确的encoding
参数一起使用以打开该文件。钻石?在控制台中只是一个占位符,因此您的默认系统编码与您显示的文件不兼容(反之亦然)。
另外,如果你不关心的“垃圾”的字符,你可以简单'ignore'
或'replace'
为errors
参数。同样,请先查阅文档以获取可用选项。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句