如何在Python3中修复此字节对象的编码以仅保留实际文本并删除'\ x00 \ x05 * \ x00 \ x00 \ x0e \ x00bjbj'?

Pythoner

问题:

我正在使用一个API,该API以字节对象的形式检索感兴趣的内容。

bytes对象(myobj)的值为:

myobj = b'\xd0\xcf\x11\xe0\xa1\xb1\x1a\xe1\x00\x00This is \rthe sentence \rI want to \rkeep.\r\r\x03\r\r\x04\r\r\x03\r\r\x04\x017\x00\x06'

问题:

我该如何保留:“这是我要保留的句子。”

我尝试过的

1:我尝试使用UTF-8进行解码,但是输出与输入相同。我还尝试了“ ascii”,“ utf-16”和“ utf-8”。如果删除“ ignore”参数,则会收到错误消息:UnicodeDecodeError:“ utf-8”编解码器无法解码位置0的字节0xd0:无效的连续字节

myobj.decode('utf-8', 'ignore')

2:尝试从字符串中使用可打印函数,该函数返回的输出几乎与输入相同。

import string
mystr =str(myobj)
print( ''.join(x for x in test2 if x in mystr.printable))

3:我也尝试使用strip()并替换以除去字符串的某些部分,但是,有太多不同的字符。

任何建议都很好。

谢谢!

丹尼尔·沃克(Daniel Walker)

你差不多了。组合选项1和2:

new_obj = ''.join(c for c in my_obj.decode('utf-8', 'ignore') if c.isprintable())

但是,您new_obj将是:

'This is the sentence I want to keep.7'

这是因为,快到快要结束my_obj'\x017'这是一个值为0x01的字节,后跟一个character '7'

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何删除那些“ \ x00 \ x00”

来自分类Dev

将 \x1d\xe3Gi%a\x00\x00\x00\x00 转换为 1de347692561

来自分类Dev

如何从列表中删除“ \ x00”

来自分类Dev

我如何将像 b'\x08\x00\x00\x00' 这样的 Python/socket 读取的雷达数据解码为数字

来自分类Dev

删除列表中数字前面的\ x00

来自分类Dev

javascript中是否存在Python的“ \ x00”?

来自分类Dev

在Django模板中处理u'\ x00'

来自分类Dev

如何从列表中删除 '\x' =[ '\xbb', '\x02', '\x00', '\x11', '\xbe']

来自分类Dev

"invalid character '\x00' after top-level value"

来自分类Dev

“顶级值后的无效字符'\ x00'”

来自分类Dev

使用Redis进行Spring Boot缓存,密钥为\ xac \ xed \ x00 \ x05t \ x00 \ x06

来自分类Dev

如何摆脱字节数组中的\ x00?

来自分类Dev

如何在Erlang中的字符串中替换NUL字符(\ x00)?

来自分类Dev

如何在C中输入/ x00内存地址?

来自分类Dev

在Python 3中将'\ x00'转换为ASCII

来自分类Dev

编辑包含'\ x00'字节的二进制流

来自分类Dev

如何将带有NUL('\ x00')行的csv读取到熊猫中?

来自分类Dev

将文本写入Accumulo时尾随空(\ x00)字符

来自分类Dev

我可以将NUL(\ x00)放在xml中吗

来自分类Dev

将字符串字节转换为类似b'\ x00 \ x01 \ x02'的字节

来自分类Dev

在python中用startswith或re测试这个字符串("\x04\x01\x00PÀcö60\x00"),但返回false

来自分类Dev

如何解决int()无法将'\ x002 \ x002 \ x001 \ x000 \ x00'转换为整数的python中的转换问题?

来自分类Dev

在python中读取SQL查询时出现问题。每个字符后添加“ \ x00”

来自分类Dev

休眠数据截断:不正确的整数值:尝试保存OneToMany关系时'\ xAC \ xED \ x00 \ x05sr \ x00&

来自分类Dev

为什么正则表达式findall返回一个奇怪的\ x00

来自分类Dev

训练 '\x00' s 和 TypeError: stat() 参数 1 必须是没有空字节的编码字符串,而不是 str

来自分类Dev

如何处理其数据中包含\ x00(或\ u0000)的API响应(JSON),并使用Django模型将数据存储在Postgres中?

来自分类Dev

UnicodeEncodeError:'十进制'编解码器无法在位置8编码字符u'\ x00':无效的十进制Unicode字符串

来自分类Dev

UnicodeEncodeError:'十进制'编解码器无法在位置8编码字符u'\ x00':无效的十进制Unicode字符串

Related 相关文章

  1. 1

    如何删除那些“ \ x00 \ x00”

  2. 2

    将 \x1d\xe3Gi%a\x00\x00\x00\x00 转换为 1de347692561

  3. 3

    如何从列表中删除“ \ x00”

  4. 4

    我如何将像 b'\x08\x00\x00\x00' 这样的 Python/socket 读取的雷达数据解码为数字

  5. 5

    删除列表中数字前面的\ x00

  6. 6

    javascript中是否存在Python的“ \ x00”?

  7. 7

    在Django模板中处理u'\ x00'

  8. 8

    如何从列表中删除 '\x' =[ '\xbb', '\x02', '\x00', '\x11', '\xbe']

  9. 9

    "invalid character '\x00' after top-level value"

  10. 10

    “顶级值后的无效字符'\ x00'”

  11. 11

    使用Redis进行Spring Boot缓存,密钥为\ xac \ xed \ x00 \ x05t \ x00 \ x06

  12. 12

    如何摆脱字节数组中的\ x00?

  13. 13

    如何在Erlang中的字符串中替换NUL字符(\ x00)?

  14. 14

    如何在C中输入/ x00内存地址?

  15. 15

    在Python 3中将'\ x00'转换为ASCII

  16. 16

    编辑包含'\ x00'字节的二进制流

  17. 17

    如何将带有NUL('\ x00')行的csv读取到熊猫中?

  18. 18

    将文本写入Accumulo时尾随空(\ x00)字符

  19. 19

    我可以将NUL(\ x00)放在xml中吗

  20. 20

    将字符串字节转换为类似b'\ x00 \ x01 \ x02'的字节

  21. 21

    在python中用startswith或re测试这个字符串("\x04\x01\x00PÀcö60\x00"),但返回false

  22. 22

    如何解决int()无法将'\ x002 \ x002 \ x001 \ x000 \ x00'转换为整数的python中的转换问题?

  23. 23

    在python中读取SQL查询时出现问题。每个字符后添加“ \ x00”

  24. 24

    休眠数据截断:不正确的整数值:尝试保存OneToMany关系时'\ xAC \ xED \ x00 \ x05sr \ x00&

  25. 25

    为什么正则表达式findall返回一个奇怪的\ x00

  26. 26

    训练 '\x00' s 和 TypeError: stat() 参数 1 必须是没有空字节的编码字符串,而不是 str

  27. 27

    如何处理其数据中包含\ x00(或\ u0000)的API响应(JSON),并使用Django模型将数据存储在Postgres中?

  28. 28

    UnicodeEncodeError:'十进制'编解码器无法在位置8编码字符u'\ x00':无效的十进制Unicode字符串

  29. 29

    UnicodeEncodeError:'十进制'编解码器无法在位置8编码字符u'\ x00':无效的十进制Unicode字符串

热门标签

归档