如何查找未包含在标签中的字符串

××××××××××××××××××××××××××××××××××

使用 Beautifulsoup,我想找到没有被标签包围的字符串并将其括起来,<p>但我不知道该怎么做。

<p>string</p>
<figure class="image"> <img alt="" src="sample.jpg"/> </figure>
string,string,string<br/>
<p>string,string</p>
string
<p><a href="/test" target="_blank">string</a></p>
textexttext
<p>stringstring</p>
<p><a href="tel:xxxxxxxx" target="_blank">xxxxxxxxxx</a></p>
<div>textextext</div>
<p>string,string<br/>string</p>

我想像上面一样更改 html

<p>string</p>
<figure class="image"> <img alt="" src="sample.jpg"/> </figure>
<p>string,string,string</p><br/>       <-here
<p>string,string</p>
<p>string</p>                     <- here
<p><a href="/test" target="_blank">string</a></p>
<p>textexttext</p>               <- here
<p>stringstring</p>
<p><a href="tel:xxxxxxxx">xxxxxxxxxx</a></p>
<div>textextext</div>
<p>string,string<br/>string</p>

我尝试了以下方法,但没有奏效

from bs4 import BeautifulSoup as BS

html = """<p>string</p>
    <figure class="image"> <img alt="" src="sample.jpg"/> </figure>
    <p>string,string,string</p><br/> <-here
    <p>string,string</p>
    <p>string</p> <- here
    <p><a href="/test" target="_blank">string</a></p>
    <p>textexttext</p>    <- here
    <p>stringstring</p>
    <p><a href="tel:xxxxxxxx" target="_blank">xxxxxxxxxx</a></p>
    <div>textextext</div>
    <p>string,string<br/>string</p>"""

soup = BS(html, "html.parser")

while True:
    text = soup.find(text=True)
    if not text:
        break
    if not text.parent.name in ['p', 'span', 'a', 'div']:
        text.wrap(content.new_tag("p"))
马丁·埃文斯

请尝试以下操作:

from bs4 import BeautifulSoup as bs

html = """<p>string</p>
<figure class="image"> <img alt="" src="sample.jpg"/> </figure>
string,string,string<br/>
<p>string,string</p>
string
<p><a href="/test" target="_blank">string</a></p>
textexttext
<p>stringstring</p>
<p><a href="tel:xxxxxxxx" target="_blank">xxxxxxxxxx</a></p>
<div>textextext</div>
<p>string,string<br/>string</p>"""

soup = bs(html, "html.parser")

for text in soup.find_all(text=True):
    if not text.parent.name in ['p', 'span', 'a', 'div'] and len(text.strip()):
        text.wrap(soup.new_tag("p"))

print soup    

这将为您提供以下输出:

<p>string</p>
<figure class="image"> <img alt="" src="sample.jpg"/> </figure><p>
string,string,string</p><br/>
<p>string,string</p><p>
string
</p><p><a href="/test" target="_blank">string</a></p><p>
textexttext
</p><p>stringstring</p>
<p><a href="tel:xxxxxxxx" target="_blank">xxxxxxxxxx</a></p>
<div>textextext</div>
<p>string,string<br/>string</p>    

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何删除未包含在标签中的其余字符串

来自分类Dev

如何查找包含在引号中并包含特定子字符串的字符串

来自分类Dev

如何查找搜索字符串的一部分是否包含在字符串中?

来自分类Dev

获取字符串Jquery中包含在标签中的字符串

来自分类Dev

如何转义要包含在字符串中的斜线?

来自分类Dev

如何根据包含在另一个数组中的字符串在NSArray中查找匹配的字典

来自分类常见问题

给定的字符串列表仅返回未包含在其他字符串中的字符串

来自分类Dev

给定的字符串列表仅返回未包含在其他字符串中的字符串

来自分类Dev

如何获得包含在指定字符串中的特定字符串?

来自分类Dev

查找字符串是否包含在同一mysql表的列中

来自分类Dev

查找包含在不同类型的双引号中的字符串

来自分类Dev

PHP正则表达式以查找包含在__(“ STRING_TO_EXTRACT”)中的字符串

来自分类Dev

来自子主题的可翻译字符串未包含在翻译文件中

来自分类Dev

查找并突出显示未包含在我的列表中的字符

来自分类Dev

如何获取长字符串中包含在特殊字符中的值

来自分类Dev

在包含在DIV中的textarea中搜索字符串

来自分类Dev

如何查找字符串S是否包含在由S制成的字符串中,该字符串插入S本身的任何位置(仅一次)

来自分类Dev

XSLT:测试字符串是否包含在序列中

来自分类Dev

匹配注释,但不包含在字符串中

来自分类Dev

包含在php字符串中时解析

来自分类Dev

MySQL where列包含在字符串中

来自分类Dev

如何查看表中的字符串是否包含在其他表中指定的字符串

来自分类Dev

如何在 Java 中解析 JSON 字符串以获取包含在其中的字符串 anotherJSON

来自分类常见问题

如何检查字符串列表中的特定单词是否包含在字符串中,但不应包含在其他任何单词之间?

来自分类Dev

如何将sid和port包含在oracle连接字符串中?

来自分类Dev

如何检查字符串是否包含在AutoHotKey的数组中

来自分类Dev

如何将文件同时包含在cpp中作为字符串和代码?

来自分类Dev

如何指定要包含在子字符串中的字母(而不是空格)的数量?

来自分类Dev

如何检查给定单词是否包含在字符串中?

Related 相关文章

  1. 1

    如何删除未包含在标签中的其余字符串

  2. 2

    如何查找包含在引号中并包含特定子字符串的字符串

  3. 3

    如何查找搜索字符串的一部分是否包含在字符串中?

  4. 4

    获取字符串Jquery中包含在标签中的字符串

  5. 5

    如何转义要包含在字符串中的斜线?

  6. 6

    如何根据包含在另一个数组中的字符串在NSArray中查找匹配的字典

  7. 7

    给定的字符串列表仅返回未包含在其他字符串中的字符串

  8. 8

    给定的字符串列表仅返回未包含在其他字符串中的字符串

  9. 9

    如何获得包含在指定字符串中的特定字符串?

  10. 10

    查找字符串是否包含在同一mysql表的列中

  11. 11

    查找包含在不同类型的双引号中的字符串

  12. 12

    PHP正则表达式以查找包含在__(“ STRING_TO_EXTRACT”)中的字符串

  13. 13

    来自子主题的可翻译字符串未包含在翻译文件中

  14. 14

    查找并突出显示未包含在我的列表中的字符

  15. 15

    如何获取长字符串中包含在特殊字符中的值

  16. 16

    在包含在DIV中的textarea中搜索字符串

  17. 17

    如何查找字符串S是否包含在由S制成的字符串中,该字符串插入S本身的任何位置(仅一次)

  18. 18

    XSLT:测试字符串是否包含在序列中

  19. 19

    匹配注释,但不包含在字符串中

  20. 20

    包含在php字符串中时解析

  21. 21

    MySQL where列包含在字符串中

  22. 22

    如何查看表中的字符串是否包含在其他表中指定的字符串

  23. 23

    如何在 Java 中解析 JSON 字符串以获取包含在其中的字符串 anotherJSON

  24. 24

    如何检查字符串列表中的特定单词是否包含在字符串中,但不应包含在其他任何单词之间?

  25. 25

    如何将sid和port包含在oracle连接字符串中?

  26. 26

    如何检查字符串是否包含在AutoHotKey的数组中

  27. 27

    如何将文件同时包含在cpp中作为字符串和代码?

  28. 28

    如何指定要包含在子字符串中的字母(而不是空格)的数量?

  29. 29

    如何检查给定单词是否包含在字符串中?

热门标签

归档