将html页中的\ n替换为python LXML中的空格

2 8

我有一个不清楚的xml,并使用python lxml模块对其进行处理。我想在进行任何处理之前将所有\n内容替换为space,该如何处理所有元素的文本。

编辑我的xml示例:

<root>
    <a> dsdfs\n dsf\n sdf\n</a>
    <bds> 
        <d>sdf\n\n\n\n\n\n</d>
        <d>sdf\n\n\nsdf\nsdf\n\n</d>
    </bds>
    ....
    ....
    ....
    ....
</root>

当我打印ittertext时,我不会在输出中得到这个:

root = #get root element
for i in root.ittertext():
   print i

dsdfs  dsf  sdf
dsdfs  dsf  sdf
sdf  nsdf sdf  
sk11

下面的代码将xml解析为字符串,然后替换\nspace,然后写入新的xml文件。您可以在这之间进行其他处理,具体取决于您要执行的操作。

from lxml import etree 
tree = etree.parse('some.xml') 
root = tree.getroot()
# Get the whole XML content as  string
xml_in_str = etree.tostring(root)

# Replace all \n with space
new_xml_data = xml_in_str.replace(r'\n', ' ')

# Do the processing with the new_xml_data string which is formatted

# Maybe also write to a new XML file, without the \n
with open('newxml.xml', 'w') as f:
    f.write(new_xml_data)

some.xml 看起来像:

<root>
    <a> dsdfs\n dsf\n sdf\n</a>
    <bds> 
        <d>sdf\n\n\n\n\n\n</d>
        <d>sdf\n\n\nsdf\nsdf\n\n</d>
    </bds>
    <bds> 
        <d>sdf\n\n\n\n\n\n</d>
        <d>sdf\n\n\nsdf\nsdf\n\n</d>
    </bds>
    <bds> 
        <d>sdf\n\n\n\n\n\n</d>
        <d>sdf\n\n\nsdf\nsdf\n\n</d>
    </bds>
</root>

newxml.xml 看起来像:

<root>
    <a> dsdfs  dsf  sdf </a>
    <bds> 
        <d>sdf      </d>
        <d>sdf   sdf sdf  </d>
    </bds>
    <bds> 
        <d>sdf      </d>
        <d>sdf   sdf sdf  </d>
    </bds>
    <bds> 
        <d>sdf      </d>
        <d>sdf   sdf sdf  </d>
    </bds>
</root>

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用Python将字符串中的“ \\”替换为空格

来自分类Dev

在python 2.7中使用lxml在网页抓取中缺少一列和多余的空格/换行符

来自分类Dev

将所有<br>标记替换为javascript中的空格

来自分类Dev

将字符串中的空格替换为零

来自分类Dev

如何将双引号替换为 VBScript 中的空格?

来自分类Dev

使用lxml将XML转换为Python中的字典

来自分类Dev

替换模式中的空格

来自分类Dev

使用批处理将txt文件中的多个空格替换为一个空格

来自分类Dev

Python列表-如何评估并将json字符串值中的空格/空/空格替换为某些默认值?

来自分类Dev

将文件中的日期替换为date-n小时

来自分类Dev

将VLOOKUP中的N / A或0替换为空白

来自分类Dev

Python字典替换键中的空格

来自分类Dev

多模式替换以及python中的空格

来自分类Dev

Python,将html文件中的行替换为其他行

来自分类Dev

在Python中查找并替换为多个for循环

来自分类Dev

替换字符串中除N,n和python中的空格以外的所有元素

来自分类Dev

如何将“&”替换为“&amp;” 在python中?

来自分类Dev

Python:将值替换为字典键值对中的值

来自分类Dev

将字符串替换为 Python 中的匹配模式

来自分类Dev

替换数组中的空格(空格)和HDOT

来自分类Dev

如何将N个空格分隔的数字转换为python中的数组?

来自分类Dev

在Python lxml中刮取HTML表

来自分类Dev

在Python lxml中刮取HTML表

来自分类Dev

查找标签并将其替换为LightTable中的空格

来自分类Dev

如何删除字符串中的空格并批量替换为(;)

来自分类Dev

bash脚本替换html中的空格

来自分类Dev

在浏览器中打开时,本地文件名中的空格将替换为零

来自分类Dev

如何将句子输入中的空格替换为输出中的破折号

来自分类Dev

如何将N个空格的起始数量替换为N + 2个空格的数量?

Related 相关文章

  1. 1

    使用Python将字符串中的“ \\”替换为空格

  2. 2

    在python 2.7中使用lxml在网页抓取中缺少一列和多余的空格/换行符

  3. 3

    将所有<br>标记替换为javascript中的空格

  4. 4

    将字符串中的空格替换为零

  5. 5

    如何将双引号替换为 VBScript 中的空格?

  6. 6

    使用lxml将XML转换为Python中的字典

  7. 7

    替换模式中的空格

  8. 8

    使用批处理将txt文件中的多个空格替换为一个空格

  9. 9

    Python列表-如何评估并将json字符串值中的空格/空/空格替换为某些默认值?

  10. 10

    将文件中的日期替换为date-n小时

  11. 11

    将VLOOKUP中的N / A或0替换为空白

  12. 12

    Python字典替换键中的空格

  13. 13

    多模式替换以及python中的空格

  14. 14

    Python,将html文件中的行替换为其他行

  15. 15

    在Python中查找并替换为多个for循环

  16. 16

    替换字符串中除N,n和python中的空格以外的所有元素

  17. 17

    如何将“&”替换为“&amp;” 在python中?

  18. 18

    Python:将值替换为字典键值对中的值

  19. 19

    将字符串替换为 Python 中的匹配模式

  20. 20

    替换数组中的空格(空格)和HDOT

  21. 21

    如何将N个空格分隔的数字转换为python中的数组?

  22. 22

    在Python lxml中刮取HTML表

  23. 23

    在Python lxml中刮取HTML表

  24. 24

    查找标签并将其替换为LightTable中的空格

  25. 25

    如何删除字符串中的空格并批量替换为(;)

  26. 26

    bash脚本替换html中的空格

  27. 27

    在浏览器中打开时,本地文件名中的空格将替换为零

  28. 28

    如何将句子输入中的空格替换为输出中的破折号

  29. 29

    如何将N个空格的起始数量替换为N + 2个空格的数量?

热门标签

归档