Python 将 3 个字符串误解为 UTF-8 连续字节

debugcn 发表于 Dev

奥列格·日林

将 Pandas 数据集保存到 Excel 时，我遇到了

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe6 in position 0: invalid continuation byte

一些挖掘表明我可以将 3 个 ascii 字符放在一起，结果字符串似乎以 UTF-8 连续字节开头。显然，字符串中没有多字节字符。克服这个问题的最佳方法是什么，以便我的所有数据都被解释为 ASCII 字符？

下面是 Python 代码，它演示了连续字节的表现方式

Python 3.7.1 (default, Dec 14 2018, 13:28:58)
[Clang 4.0.1 (tags/RELEASE_401/final)] :: Anaconda, Inc. on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> string_from_3_ascii_chars = chr(50) + chr(51) + chr(48)
>>> print(string_from_3_ascii_chars)
230
>>> print(string_from_3_ascii_chars.startswith(str(0xe6)))
True
>>>

奥列格·日林

在所讨论的示例中，str(0xe6)采用一个整数0xe6（230十进制表示法）并调用repr(object)它。这会产生 string '230'。string_from_3_ascii_chars确实以'230'. startswith通过返回来确认这一点True。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-28

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

Python 将 3 个字符串误解为 UTF-8 连续字节

Python 将 3 个字符串误解为 UTF-8 连续字节

python用3个字节的utf8字符拆分unicode字符串

Python：将utf-8字符串转换为字节字符串

Python：将utf-8字符串转换为字节字符串

Python将utf-8字节转换为字符串

Python将utf-8字节转换为字符串

将utf-8字节转换为字符串python

python3将str解码为utf8

Swift 3：如何将UTF8数据流（每个字符1,2、3或4个字节）转换为String？

在python 3中将转义的utf-8字符串转换为utf

Python'utf8'编解码器无法解码位置72的字节0xc3：无效的连续字节

如何在python2中将utf-8字节数组解码为字符串？

将 UTF8 字符编码为字节表或公式

在Python 3中将字符编码为utf-8十六进制

java utf-8编码字节的字符串更改为奇数个字符

使用python将utf-8字符串保存到sqlite表中（sqlite3模块）

我如何强制将每个字符串编码为UTF8，而不管其原始类型是什么？

python 3中的字节流和utf-8

将字节缓冲区转换为UTF8字符串

Python：UnicodeDecodeError：'utf-8'编解码器无法解码字节...无效的连续字节

将URL编码的字符串（UTF-8）转换为Python中的字符串？

将Python 3 unicode转换为utf-8

Java字符串UTF-8将0xFF解码为0xC3BF

Java字符串UTF-8将0xFF解码为0xC3BF

如何将UTF-8格式的字符串（不是bytes []）解码为Java中的另一个字符串？

在Python中将utf-8字符串拆分为字节

python 会自动解码 ASCII 和 UTF-8 字节字符串吗？

将20个字符的字符串编码为8个字符，然后解码回去

如何使用iconv（3）将宽字符串转换为UTF-8？

在python 3中将字节解码为字符串或ASCII的问题