使用 BeautifulSoup 和 Python 从多个标签中提取文本,例如具有类的 h1 和 p 标签

Kamikaze_goldfish

我已经想出了如何从 中提取文本itemprop但我无法从中提取文本<div clas="someclass">Extract This Text Here!</div>我只粘贴了我的代码中不起作用的部分,但如果需要,将粘贴整个内容。

我已经用 BeautifulSoup 和 Python 设置了一个变量来获取页面,但它不会只抓取文本。

编辑:有些文本包含在h1标签中,有些文本位于p具有多个跨度标签中。

编辑 2:所以一些数据在 a 中<div class=“someclass”><h1>There’s the text</h1></div>,另一个在<p class=“anotherclass”><span>This is another text</span></p>. 如何从多个标签中提取文本?

for each_business in info:
    yp_bus_url = each_business.find('a', {'class': 'business-name'}).get('href')
    whole_url = "https://www.yellowpages.com"+yp_bus_url
    print(whole_url)
    bus_page = requests.get(whole_url)
    bus_soup = BeautifulSoup(page.text, 'html.parser')
    # The variable below wont get text. I've tried different variations with it too but it doesn't work.
    business_name = bus_soup.findAll("div", class_="sales-info")
    print(business_name)
哈里·克里希南

我已经使用您在问题中给出的 html 来提取里面的文本<p><div>标签。我希望这就是你要找的

html='''<div class="someclass"><h1>There’s the text</h1></div><p class="anotherclass"><span>This is another text</span>'''
soup = BeautifulSoup(html,'lxml')
print(soup.find('div',class_='someclass').text)
print(soup.find('p',class_='anotherclass').text)

输出这是
文本
这是另一个文本

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用 Python 和 BeautifulSoup 抓取 alt 标签

来自分类Dev

替换beautifulsoup中的<p>和<br>标签

来自分类Dev

使用BeautifulSoup和Python从item标签获取地址文本

来自分类Dev

如何使用Python和BeautifulSoup中的类过滤标签?

来自分类Dev

xslt-1.0 使用 <h1> 和 <h2> 创建 xml 标签

来自分类Dev

如何使用python和BeautifulSoup在xml中提取父元素的标签

来自分类Dev

使用Python和BeautifulSoup根据属性解析“ a”标签

来自分类Dev

使用Python和BeautifulSoup访问网页中标签的标题属性

来自分类Dev

使用 python 和 BeautifulSoup 抓取不完整的标签

来自分类Dev

使用 Python、Selenium 和 BeautifulSoup 来抓取标签的内容?

来自分类Dev

使用Selenium获取标签“ h1”和id中的信息

来自分类Dev

带有h1和p的文本旁边的图像

来自分类Dev

使用应用脚本返回所有<p>和<h>标签

来自分类Dev

BeautifulSoup和Python删除HTML标签

来自分类Dev

Python beautifulsoup 新标签和组织输入

来自分类Dev

使用 Python/Scrapy 在 h1 中提取 p

来自分类Dev

使用python和p4v获取标签的日期

来自分类Dev

使用 Python 和 BeautifulSoup 提取数字(多个跨度和类)

来自分类Dev

如何使用 Selenium 和 BeautifulSoup 从标签中获取文本

来自分类Dev

使用beautifulsoup获取多个标签和属性数据

来自分类Dev

与BeautifulSoup和标签作斗争

来自分类Dev

使用 Python 和 BeautifulSoup 从嵌入的推文中提取文本

来自分类Dev

python beautifulsoup解析'a'标签和href时没有链接

来自分类Dev

如何使用BeautifulSoup和Python请求获得具有强标签的段落及其下面的三个段落?

来自分类Dev

如何在视频下响应H标签和P标签

来自分类Dev

在 <h1> 标签中写出 HTML <p> 标签

来自分类Dev

两行带有h1标签中的链接和跨度

来自分类Dev

我的带有<a>和<h1>标签的代码获取元素

来自分类Dev

使用Python和BeautifulSoup从HTML中删除某些类型的标签(无字符串操作)

Related 相关文章

  1. 1

    使用 Python 和 BeautifulSoup 抓取 alt 标签

  2. 2

    替换beautifulsoup中的<p>和<br>标签

  3. 3

    使用BeautifulSoup和Python从item标签获取地址文本

  4. 4

    如何使用Python和BeautifulSoup中的类过滤标签?

  5. 5

    xslt-1.0 使用 <h1> 和 <h2> 创建 xml 标签

  6. 6

    如何使用python和BeautifulSoup在xml中提取父元素的标签

  7. 7

    使用Python和BeautifulSoup根据属性解析“ a”标签

  8. 8

    使用Python和BeautifulSoup访问网页中标签的标题属性

  9. 9

    使用 python 和 BeautifulSoup 抓取不完整的标签

  10. 10

    使用 Python、Selenium 和 BeautifulSoup 来抓取标签的内容?

  11. 11

    使用Selenium获取标签“ h1”和id中的信息

  12. 12

    带有h1和p的文本旁边的图像

  13. 13

    使用应用脚本返回所有<p>和<h>标签

  14. 14

    BeautifulSoup和Python删除HTML标签

  15. 15

    Python beautifulsoup 新标签和组织输入

  16. 16

    使用 Python/Scrapy 在 h1 中提取 p

  17. 17

    使用python和p4v获取标签的日期

  18. 18

    使用 Python 和 BeautifulSoup 提取数字(多个跨度和类)

  19. 19

    如何使用 Selenium 和 BeautifulSoup 从标签中获取文本

  20. 20

    使用beautifulsoup获取多个标签和属性数据

  21. 21

    与BeautifulSoup和标签作斗争

  22. 22

    使用 Python 和 BeautifulSoup 从嵌入的推文中提取文本

  23. 23

    python beautifulsoup解析'a'标签和href时没有链接

  24. 24

    如何使用BeautifulSoup和Python请求获得具有强标签的段落及其下面的三个段落?

  25. 25

    如何在视频下响应H标签和P标签

  26. 26

    在 <h1> 标签中写出 HTML <p> 标签

  27. 27

    两行带有h1标签中的链接和跨度

  28. 28

    我的带有<a>和<h1>标签的代码获取元素

  29. 29

    使用Python和BeautifulSoup从HTML中删除某些类型的标签(无字符串操作)

热门标签

归档