LXML用unicode编写?

大卫542

我目前正在使用lxml编写文件。我先构建节点,然后使用将其写入文件etree.tostring(node, pretty_print=True)但是,它似乎正在使用htmlencoding-

<Synopsis>
    Abila schlie&#223;lich die ersten sechs Aufgaben zu meistern. Wird der Junge auch 
</Synopsis>

为了解密它并使其成为我想要的格式,我目前正在做:

>>> print HTMLParser.HTMLParser().unescape('Abila schlie&#223;lich die ersten sechs Aufgaben zu meistern. Wird der Junge auch')
Abila schließlich die ersten sechs Aufgaben zu meistern. Wird der Junge auch

我将如何用unicode编写此代码,或者使用unicode无法实现lxml

马克西姆

是的,您可以etree.tostring使用encoding参数将编码传递给方法

etree.tostring(node, pretty_print=True, encoding='unicode')

etree.tostring 文档

您还可以通过将unicode函数传递为编码(或str在Py3中)或名称“ unicode”来序列化为Unicode字符串而无需声明这会将返回值从字节字符串更改为未编码的unicode字符串。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章