如何提取以某些单词开头的特定标题下的文本

debugcn 发表于 Dev

是的

我正在尝试在H2标签中的标题下刮擦文本，该标题以“ ...的好处”开头...因此它可能像“玩具的好处”或“杯子的好处”等。

html代码是：

<h2 class="DrugOverview__title___1OwgG">Benefits of Toys</h2>

我到目前为止使用的代码是

        benfit = soup.find('h2',text='Benefits of')
        q = benefit.get_text(strip=True)

我该如何解决？还请记住，在这种情况下，h2类不能用于抓取（由于其他问题）。

Subbu vidyaSekar

我们可以使用正则表达式来获取一些特定的字符串

我用作strs输入html内容

使用以下代码：

import re
strs = '<h2 class="DrugOverview__title___1OwgG">Benefits of Toys</h2><h2 class="DrugOverview__title___1OwgG">Benefits of kids</h2>'
soup = BeautifulSoup(strs, 'html.parser')
pattern = re.compile(r'Benefits of')
benefit =  soup.findAll(text = pattern)
print(benefit)

输出：

['Benefits of Toys', 'Benefits of kids']

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-6

我来说两句

0条评论

登录后参与评论

来自分类Dev

使用BeautifulSoup提取特定标题下的文本

来自分类Dev

漂亮的汤：从列表中提取文本和网址，但仅在特定标题下

来自分类Dev

如何在文本文档中特定标题下创建项目列表？（Linux / Bash）

来自分类Dev

如何在特定标题下隐藏表格列？

来自分类Dev

在固定标题下抓取可变文本

来自分类Dev

如何使用python从docx文件中的标题下提取文本

来自分类Dev

如何计算特定标题下方的 html 表格中数字的乘法 - IONIC

来自分类Dev

提取文本以 R 上的特定单词开头

来自分类Dev

OOXML-Linq提取带有特定标题的单词表

来自分类Dev

从文本文件中提取特定单词后的单词并放入特定标签之间的 XML 文件中

来自分类Dev

从嵌套的HTML中提取文本内容，同时排除某些特定标签；cra草

来自分类Dev

删除所有以特定标题开头的文件

来自分类Dev

如何从文本文件中读取标题下的文本

来自分类Dev

如何在标题下垂直添加文本

来自分类Dev

读取多行文本（如果以特定标记开头）

来自分类Dev

如何提取包含特定单词的括号之间的文本？

来自分类Dev

如何从以特定单词/字符串开头的文本文件中选择特定行？

来自分类Dev

如何替换单词以某些字符开头和以某些字符结尾

来自分类Dev

仅折叠单词标题下的选定内容

来自分类Dev

jQuery使用.text（）提取文本（特定标记除外）

来自分类Dev

在特定标记后从html提取所有文本？

来自分类Dev

将div向下移到固定标题下方

来自分类Dev

从以辅音开头并以元音结尾的文本中提取单词

来自分类Dev

提取以“引号”开头的单词

来自分类Dev

如何从bash中的文本文件中提取某些单词和值

来自分类Dev

如何从 bash 输出中保存以文件中特定单词开头的文本？

来自分类Dev

如何提取某些单词的首字母

来自分类Dev

如何在某些字符之间提取单词

来自分类Dev

如何找到以特定字母开头的单词？

Related 相关文章

文章