如何提取以某些单词开头的特定标题下的文本

是的

我正在尝试在H2标签中的标题下刮擦文本,该标题以“ ...的好处”开头...因此它可能像“玩具的好处”或“杯子的好处”等。

html代码是:

<h2 class="DrugOverview__title___1OwgG">Benefits of Toys</h2>

我到目前为止使用的代码是

        benfit = soup.find('h2',text='Benefits of')
        q = benefit.get_text(strip=True)

我该如何解决?还请记住,在这种情况下,h2类不能用于抓取(由于其他问题)。

Subbu vidyaSekar

我们可以使用正则表达式来获取一些特定的字符串

我用作strs输入html内容

使用以下代码:

import re
strs = '<h2 class="DrugOverview__title___1OwgG">Benefits of Toys</h2><h2 class="DrugOverview__title___1OwgG">Benefits of kids</h2>'
soup = BeautifulSoup(strs, 'html.parser')
pattern = re.compile(r'Benefits of')
benefit =  soup.findAll(text = pattern)
print(benefit)

输出:

['Benefits of Toys', 'Benefits of kids']

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用BeautifulSoup提取特定标题下的文本

来自分类Dev

漂亮的汤:从列表中提取文本和网址,但仅在特定标题下

来自分类Dev

如何在文本文档中特定标题下创建项目列表?(Linux / Bash)

来自分类Dev

如何在特定标题下隐藏表格列?

来自分类Dev

在固定标题下抓取可变文本

来自分类Dev

如何使用python从docx文件中的标题下提取文本

来自分类Dev

如何计算特定标题下方的 html 表格中数字的乘法 - IONIC

来自分类Dev

提取文本以 R 上的特定单词开头

来自分类Dev

OOXML-Linq提取带有特定标题的单词表

来自分类Dev

从文本文件中提取特定单词后的单词并放入特定标签之间的 XML 文件中

来自分类Dev

从嵌套的HTML中提取文本内容,同时排除某些特定标签;cra草

来自分类Dev

删除所有以特定标题开头的文件

来自分类Dev

如何从文本文件中读取标题下的文本

来自分类Dev

如何在标题下垂直添加文本

来自分类Dev

读取多行文本(如果以特定标记开头)

来自分类Dev

如何提取包含特定单词的括号之间的文本?

来自分类Dev

如何从以特定单词/字符串开头的文本文件中选择特定行?

来自分类Dev

如何替换单词以某些字符开头和以某些字符结尾

来自分类Dev

仅折叠单词标题下的选定内容

来自分类Dev

jQuery使用.text()提取文本(特定标记除外)

来自分类Dev

在特定标记后从html提取所有文本?

来自分类Dev

将div向下移到固定标题下方

来自分类Dev

从以辅音开头并以元音结尾的文本中提取单词

来自分类Dev

提取以“引号”开头的单词

来自分类Dev

如何从bash中的文本文件中提取某些单词和值

来自分类Dev

如何从 bash 输出中保存以文件中特定单词开头的文本?

来自分类Dev

如何提取某些单词的首字母

来自分类Dev

如何在某些字符之间提取单词

来自分类Dev

如何找到以特定字母开头的单词?

Related 相关文章

  1. 1

    使用BeautifulSoup提取特定标题下的文本

  2. 2

    漂亮的汤:从列表中提取文本和网址,但仅在特定标题下

  3. 3

    如何在文本文档中特定标题下创建项目列表?(Linux / Bash)

  4. 4

    如何在特定标题下隐藏表格列?

  5. 5

    在固定标题下抓取可变文本

  6. 6

    如何使用python从docx文件中的标题下提取文本

  7. 7

    如何计算特定标题下方的 html 表格中数字的乘法 - IONIC

  8. 8

    提取文本以 R 上的特定单词开头

  9. 9

    OOXML-Linq提取带有特定标题的单词表

  10. 10

    从文本文件中提取特定单词后的单词并放入特定标签之间的 XML 文件中

  11. 11

    从嵌套的HTML中提取文本内容,同时排除某些特定标签;cra草

  12. 12

    删除所有以特定标题开头的文件

  13. 13

    如何从文本文件中读取标题下的文本

  14. 14

    如何在标题下垂直添加文本

  15. 15

    读取多行文本(如果以特定标记开头)

  16. 16

    如何提取包含特定单词的括号之间的文本?

  17. 17

    如何从以特定单词/字符串开头的文本文件中选择特定行?

  18. 18

    如何替换单词以某些字符开头和以某些字符结尾

  19. 19

    仅折叠单词标题下的选定内容

  20. 20

    jQuery使用.text()提取文本(特定标记除外)

  21. 21

    在特定标记后从html提取所有文本?

  22. 22

    将div向下移到固定标题下方

  23. 23

    从以辅音开头并以元音结尾的文本中提取单词

  24. 24

    提取以“引号”开头的单词

  25. 25

    如何从bash中的文本文件中提取某些单词和值

  26. 26

    如何从 bash 输出中保存以文件中特定单词开头的文本?

  27. 27

    如何提取某些单词的首字母

  28. 28

    如何在某些字符之间提取单词

  29. 29

    如何找到以特定字母开头的单词?

热门标签

归档