搜索

搜索

从Python Unicode字符串获取UTF-8字符代码

Component 10 发表于 Dev

31

组成部分10

我正在从命令行中读取一个字符串，该字符串以韩语编码为UTF-8。我通过运行这样的命令来获取字符串

<my_command> | od -t x1

这给了我：

0000000 ec a7 80 ec 97 ad 2f ea b5 ad ea b0 80 0a
0000016

有六个UTF-8字符{eca780}{ec97ad}{2f}{eab5ad}{eab080}{0a}，然后我使用Python在其中读取

utf8_str = unicode(text_from_the_cl, encoding='utf-8')

我只想做的就是能够以已读字符的UTF-8代码查看已读字符串。所以类似的东西\uc9c0\uc5ed/\uad6d\uac00会很好。这只是为了检查它们是否被正确读取。

（我还要指出，这是Python 2.6.x-我无法控制它）

马丁·彼得斯（Martijn Pieters）

如果要验证unicode字符串的内容，请使用以下repr()函数：

>>> from binascii import unhexlify
>>> unhexlify(''.join('ec a7 80 ec 97 ad 2f ea b5 ad ea b0 80 0a'.split()))
'\xec\xa7\x80\xec\x97\xad/\xea\xb5\xad\xea\xb0\x80\n'
>>> print unhexlify(''.join('ec a7 80 ec 97 ad 2f ea b5 ad ea b0 80 0a'.split())).decode('utf8')
지역/국가

>>> print repr(unhexlify(''.join('ec a7 80 ec 97 ad 2f ea b5 ad ea b0 80 0a'.split())).decode('utf8'))
u'\uc9c0\uc5ed/\uad6d\uac00\n'

值的repr()结果对非ASCII和非Latin1代码点unicode使用\uhhhh转义序列。对于Latin 1代码点和不可打印字符，使用\xhh转义序列。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-12

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

从Python Unicode字符串获取UTF-8字符代码

来自分类Dev

Python反转UTF-8字符串

来自分类Dev

python用3个字节的utf8字符拆分unicode字符串

来自分类Dev

Python：将utf-8字符串转换为字节字符串

来自分类Dev

Python：将utf-8字符串转换为字节字符串

来自分类Dev

如何删除python字符串的最后utf8字符

来自分类Dev

如何在Python中用前面的数字分割utf-8字符串？

来自分类Dev

Python 3.3 C-API和UTF-8字符串

来自分类Dev

Python将UTF8字符串插入SQLite

来自分类Dev

如何在python中构建utf8字符串

来自分类Dev

清单元素上的python 3.4 UTF 8字符串

来自分类Dev

Python：如何从sqlite数据库查询utf-8字符串

来自分类Dev

utf-8字符串从python到AWS中的Java android

来自分类Dev

在Python中将utf-8字符串拆分为字节

来自分类Dev

在python中获取unicode字符串中的字符数

来自分类Dev

utf-8列表和utf-8字符串的python交集

来自分类Dev

在Python 3中，如何从字符串中删除所有非UTF8字符？

来自分类Dev

在python 3中将转义的utf-8字符串转换为utf

来自分类Dev

无法转换UTF-8字符-Python

来自分类Dev

在python 2.7中打印UTF-8字符

来自分类Dev

用Python计算UTF8字符

来自分类Dev

声明为utf-8的模块中的Python Unicode字符串文字

来自分类Dev

如何在python中将unicode字符串编码为utf-8？

来自分类Dev

将utf-8格式的字符串转换为unicode：Python

来自分类Dev

Python：通过utf-8字符串进行迭代->迭代器的数据类型/编码是什么？

来自分类Dev

使用python将utf-8字符串保存到sqlite表中（sqlite3模块）

来自分类Dev

插入utf-8字符串时出现python和sqlite3.ProgrammingError

来自分类Dev

Python如何从Unicode字符串中获取空填充字节字符串

来自分类Dev

UTF-8无法在我的python代码中编码UTF-8字符。它们显示为原义UTF-8

Related 相关文章

文章

热门标签

归档