我目前正在使用lxml编写文件。我先构建节点,然后使用将其写入文件etree.tostring(node, pretty_print=True)
。但是,它似乎正在使用htmlencoding-
<Synopsis>
Abila schließlich die ersten sechs Aufgaben zu meistern. Wird der Junge auch
</Synopsis>
为了解密它并使其成为我想要的格式,我目前正在做:
>>> print HTMLParser.HTMLParser().unescape('Abila schließlich die ersten sechs Aufgaben zu meistern. Wird der Junge auch')
Abila schließlich die ersten sechs Aufgaben zu meistern. Wird der Junge auch
我将如何用unicode编写此代码,或者使用unicode无法实现lxml
?
是的,您可以etree.tostring
使用encoding
参数将编码传递给方法:
etree.tostring(node, pretty_print=True, encoding='unicode')
从etree.tostring
文档:
您还可以通过将
unicode
函数传递为编码(或str
在Py3中)或名称“ unicode”来序列化为Unicode字符串而无需声明。这会将返回值从字节字符串更改为未编码的unicode字符串。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句