如何在Python3中修复此字节对象的编码以仅保留实际文本并删除'\ x00 \ x05 * \ x00 \ x00 \ x0e \ x00bjbj'？

debugcn 发表于 Dev

Pythoner

问题：

我正在使用一个API，该API以字节对象的形式检索感兴趣的内容。

bytes对象（myobj）的值为：

myobj = b'\xd0\xcf\x11\xe0\xa1\xb1\x1a\xe1\x00\x00This is \rthe sentence \rI want to \rkeep.\r\r\x03\r\r\x04\r\r\x03\r\r\x04\x017\x00\x06'

问题：

我该如何保留：“这是我要保留的句子。”

我尝试过的

1：我尝试使用UTF-8进行解码，但是输出与输入相同。我还尝试了“ ascii”，“ utf-16”和“ utf-8”。如果删除“ ignore”参数，则会收到错误消息：UnicodeDecodeError：“ utf-8”编解码器无法解码位置0的字节0xd0：无效的连续字节

myobj.decode('utf-8', 'ignore')

2：尝试从字符串中使用可打印函数，该函数返回的输出几乎与输入相同。

import string
mystr =str(myobj)
print( ''.join(x for x in test2 if x in mystr.printable))

3：我也尝试使用strip（）并替换以除去字符串的某些部分，但是，有太多不同的字符。

任何建议都很好。

谢谢！

丹尼尔·沃克（Daniel Walker）

你差不多了。组合选项1和2：

new_obj = ''.join(c for c in my_obj.decode('utf-8', 'ignore') if c.isprintable())

但是，您new_obj将是：

'This is the sentence I want to keep.7'

这是因为，快到快要结束my_obj了'\x017'。这是一个值为0x01的字节，后跟一个character '7'。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-5

我来说两句

0条评论

登录后参与评论

来自分类Dev

如何删除那些“ \ x00 \ x00”

来自分类Dev

将 \x1d\xe3Gi%a\x00\x00\x00\x00 转换为 1de347692561

来自分类Dev

如何从列表中删除“ \ x00”

来自分类Dev

我如何将像 b'\x08\x00\x00\x00' 这样的 Python/socket 读取的雷达数据解码为数字

来自分类Dev

删除列表中数字前面的\ x00

来自分类Dev

javascript中是否存在Python的“ \ x00”？

来自分类Dev

在Django模板中处理u'\ x00'

来自分类Dev

如何从列表中删除 '\x' =[ '\xbb', '\x02', '\x00', '\x11', '\xbe']

来自分类Dev

"invalid character '\x00' after top-level value"

来自分类Dev

“顶级值后的无效字符'\ x00'”

来自分类Dev

使用Redis进行Spring Boot缓存，密钥为\ xac \ xed \ x00 \ x05t \ x00 \ x06

来自分类Dev

如何摆脱字节数组中的\ x00？

来自分类Dev

如何在Erlang中的字符串中替换NUL字符（\ x00）？

来自分类Dev

如何在C中输入/ x00内存地址？

来自分类Dev

在Python 3中将'\ x00'转换为ASCII

来自分类Dev

编辑包含'\ x00'字节的二进制流

来自分类Dev

如何将带有NUL（'\ x00'）行的csv读取到熊猫中？

来自分类Dev

将文本写入Accumulo时尾随空（\ x00）字符

来自分类Dev

我可以将NUL（\ x00）放在xml中吗

来自分类Dev

将字符串字节转换为类似b'\ x00 \ x01 \ x02'的字节

来自分类Dev

在python中用startswith或re测试这个字符串("\x04\x01\x00PÀcö60\x00")，但返回false

来自分类Dev

如何解决int（）无法将'\ x002 \ x002 \ x001 \ x000 \ x00'转换为整数的python中的转换问题？

来自分类Dev

在python中读取SQL查询时出现问题。每个字符后添加“ \ x00”

来自分类Dev

休眠数据截断：不正确的整数值：尝试保存OneToMany关系时'\ xAC \ xED \ x00 \ x05sr \ x00＆

来自分类Dev

为什么正则表达式findall返回一个奇怪的\ x00

来自分类Dev

训练 '\x00' s 和 TypeError: stat() 参数 1 必须是没有空字节的编码字符串，而不是 str

来自分类Dev

如何处理其数据中包含\ x00（或\ u0000）的API响应（JSON），并使用Django模型将数据存储在Postgres中？

来自分类Dev

UnicodeEncodeError：'十进制'编解码器无法在位置8编码字符u'\ x00'：无效的十进制Unicode字符串

来自分类Dev

UnicodeEncodeError：'十进制'编解码器无法在位置8编码字符u'\ x00'：无效的十进制Unicode字符串

Related 相关文章

文章