在BeautifulSoup中提取多个Span标签中的内容

daOnlyBG

我正在尝试从多个span标签中提取字符串内容。HTML页面的快照是:

<div class="secondary-attributes">
    <span class="neighborhood-str-list">
        Southeast
    </span>
    <address>
        1234 Python Blvd S<br>Somewhere, NV 98765
    </address>
    <span class="biz-phone">
        (555) 123-4567
    </span>
</div>

具体来说,我试图提取位于<span class="biz-phone></span>标签之间的电话号码我尝试使用以下代码进行操作:

import requests
from bs4 import BeautifulSoup

res = requests.get(url)
soup = BeautifulSoup(res.text, "html.parser")

phone_number_results = [phone_numbers for phone_numbers in soup.find_all('span','biz-phone')]

编译后的代码没有任何语法错误,但是并没有完全满足我的期望:

['<span class="biz-phone">\n        (702) 476-5050\n    </span>', '<span class="biz-phone">\n        (702) 253-7296\n    </span>', '<
span class="biz-phone">\n        (702) 385-7912\n    </span>', '<span class="biz-phone">\n        (702) 776-7061\n    </span>', '<spa
n class="biz-phone">\n        (702) 221-7296\n    </span>', '<span class="biz-phone">\n        (702) 252-7296\n    </span>', '<span c
lass="biz-phone">\n        (702) 659-9101\n    </span>', '<span class="biz-phone">\n        (702) 355-9445\n    </span>', '<span clas
s="biz-phone">\n        (702) 396-3333\n    </span>', '<span class="biz-phone">\n        (702) 643-9851\n    </span>', '<span class="

biz-phone">\n        (702) 222-1441\n    </span>']

我的问题分为两部分:

  1. 为什么span在运行程序时出现标签?
  2. 我如何摆脱它们?我可以进行字符串编辑,但是我觉得我不会充分利用BeautifulSoup软件包。有没有更优雅的方式?

注意:还有更多HTML代码片段,如整个页面中上面显示的代码片段;有更多的<span class="biz-phone"> (555) 123-4567 </span>代码实例例如,更多的电话号码)需要提取,因此我为什么要使用find_all()

先感谢您。

dmcc
  1. find_all()返回标记列表(bs4.element.Tag),而不是字符串。

  2. 正如@furas指出的那样,您想访问text每个标签上属性以提取标签内的文本:

    phone_number_results = [phone_numbers.text.strip() for phone_numbers in soup.find_all('span', 'biz-phone')]

(您可能还想打电话strip()

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

从Beautifulsoup的“提取”标签中提取内容

来自分类Dev

BeautifulSoup:如何提取封装在多个 div/span/id 标签中的文本

来自分类Dev

Python BeautifulSoup从组div标签中的html文件p标签中提取内容。我正在打印空白

来自分类Dev

使用BeautifulSoup提取<span> WITH标签

来自分类Dev

从标签中提取多个标签

来自分类Dev

从<script>标签BeautifulSoup4中提取令牌,请求

来自分类Dev

仅从 BeautifulSoup 中的标签中提取最后一项

来自分类Dev

从内容中提取html标签:在Yahoo Pipes中编码

来自分类Dev

从多个标签中提取innerHTML

来自分类Dev

从标签beautifulsoup python中提取类名

来自分类Dev

从BeautifulSoup标签元素中提取文本

来自分类Dev

BeautifulSoup从多个表中提取数据

来自分类Dev

Python - BeautifulSoup 从多个选项中提取值

来自分类Dev

使用 BeautifulSoup 和 Python 从多个标签中提取文本,例如具有类的 h1 和 p 标签

来自分类Dev

如何使用Python在BeautifulSoup中的同一div中提取具有相同标签的元素?

来自分类Dev

如何使用 Python 中的 BeautifulSoup 从 HTML 页面中提取表格内容?

来自分类Dev

如何从linux中的多个xml文件中提取多个标签值

来自分类Dev

使用 BeautifulSoup 提取 span 元素中的文本

来自分类Dev

如何在Linux中从文本文件中提取任意标签并测量内容长度

来自分类Dev

如何从BeautifulSoup中的span标签获取文本

来自分类Dev

使用BeautifulSoup Python在span标签之间提取数据

来自分类Dev

如何从URL中只有月份和年份的网站中的多个表中提取内容

来自分类Dev

如何使用BeautifulSoup在html注释标签中提取json?

来自分类Dev

BeautifulSoup4 不能只从标签中提取文本

来自分类Dev

使用 BeautifulSoup 从 <a href 标签中提取特定页面链接

来自分类Dev

BeautifulSoup:在Python中提取“ img alt”内容Web爬网

来自分类Dev

无法通过BeautifulSoup从$ 0的DOM元素中提取内容

来自分类Dev

使用 python BeautifulSoup 从 html 中提取特定内容

来自分类Dev

在 PYTHON 中提取标签中的单词

Related 相关文章

  1. 1

    从Beautifulsoup的“提取”标签中提取内容

  2. 2

    BeautifulSoup:如何提取封装在多个 div/span/id 标签中的文本

  3. 3

    Python BeautifulSoup从组div标签中的html文件p标签中提取内容。我正在打印空白

  4. 4

    使用BeautifulSoup提取<span> WITH标签

  5. 5

    从标签中提取多个标签

  6. 6

    从<script>标签BeautifulSoup4中提取令牌,请求

  7. 7

    仅从 BeautifulSoup 中的标签中提取最后一项

  8. 8

    从内容中提取html标签:在Yahoo Pipes中编码

  9. 9

    从多个标签中提取innerHTML

  10. 10

    从标签beautifulsoup python中提取类名

  11. 11

    从BeautifulSoup标签元素中提取文本

  12. 12

    BeautifulSoup从多个表中提取数据

  13. 13

    Python - BeautifulSoup 从多个选项中提取值

  14. 14

    使用 BeautifulSoup 和 Python 从多个标签中提取文本,例如具有类的 h1 和 p 标签

  15. 15

    如何使用Python在BeautifulSoup中的同一div中提取具有相同标签的元素?

  16. 16

    如何使用 Python 中的 BeautifulSoup 从 HTML 页面中提取表格内容?

  17. 17

    如何从linux中的多个xml文件中提取多个标签值

  18. 18

    使用 BeautifulSoup 提取 span 元素中的文本

  19. 19

    如何在Linux中从文本文件中提取任意标签并测量内容长度

  20. 20

    如何从BeautifulSoup中的span标签获取文本

  21. 21

    使用BeautifulSoup Python在span标签之间提取数据

  22. 22

    如何从URL中只有月份和年份的网站中的多个表中提取内容

  23. 23

    如何使用BeautifulSoup在html注释标签中提取json?

  24. 24

    BeautifulSoup4 不能只从标签中提取文本

  25. 25

    使用 BeautifulSoup 从 <a href 标签中提取特定页面链接

  26. 26

    BeautifulSoup:在Python中提取“ img alt”内容Web爬网

  27. 27

    无法通过BeautifulSoup从$ 0的DOM元素中提取内容

  28. 28

    使用 python BeautifulSoup 从 html 中提取特定内容

  29. 29

    在 PYTHON 中提取标签中的单词

热门标签

归档