我必须使用哪种python编码类型来读取非utf-8字符？

debugcn 发表于 Dev

第648章

我必须让我的python脚本读取DNA查询字符串文件并使用它进行搜索。

好吧，文件包含这种类型的字符：

并且python默认编码无法使用readline（）函数读取文件的这一行。引发以下错误：

[...]
File "/usr/lib/python3.4/codecs.py", line 319, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x81 in position 860: invalid start byte

我也尝试过utf_16和ascii，但是没有任何积极的结果。我该怎么读？

元烤面包机

您需要首先弄清楚您必须阅读的文本文件的实际编码，然后将其open与该文件和正确的encoding参数一起使用以打开该文件。钻石？在控制台中只是一个占位符，因此您的默认系统编码与您显示的文件不兼容（反之亦然）。

另外，如果你不关心的“垃圾”的字符，你可以简单'ignore'或'replace'为errors参数。同样，请先查阅文档以获取可用选项。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-12

我来说两句

0条评论

登录后参与评论

来自分类Dev

UTF-8字符的属性

来自分类Dev

UTF8字符编码错误

来自分类Dev

从包含utf 8字符的属性文件中读取

来自分类Dev

从字节流中读取utf-8字符

来自分类Dev

Swift UTF8编码和非UTF8字符

来自分类Dev

无法转换UTF-8字符-Python

来自分类Dev

在python 2.7中打印UTF-8字符

来自分类Dev

Python反转UTF-8字符串

来自分类Dev

用Python计算UTF8字符

来自分类Dev

使用HTML / UTF-8字符作为光标

来自分类Dev

使用CListCtrl显示utf-8字符

来自分类Dev

使用CListCtrl显示utf-8字符

来自分类Dev

Perl DBI，MySQL中使用ő和ű字符的UTF8字符编码

来自分类Dev

Perl DBI，MySQL中使用ő和ű字符的UTF8字符编码

来自分类Dev

utf8字符集与Thymeleaf

来自分类Dev

UTF8字符串上的==是否安全？

来自分类Dev

UTF 8字符的Base64解码并打印

来自分类Dev

单个UTF-8字符到字节

来自分类Dev

mysql regex utf-8字符

来自分类Dev

重写htaccess中的utf8字符

来自分类Dev

灯箱显示UTF-8字符而不是箭头

来自分类Dev

无法用RegExp替换UTF-8字符

来自分类Dev

UTF-8字符集问题

来自分类Dev

R，utf-8字符似乎无法滑动

来自分类Dev

Sweet Alerts显示UTF-8字符错误

来自分类Dev

imagestring（）函数中的utf-8字符

来自分类Dev

Netbeans C ++不打印UTF-8字符

来自分类Dev

Internet Explorer中的粗体UTF-8字符

来自分类Dev

文字UTF-8字符的数值

Related 相关文章

文章