BeautifulSoup:如何提取标签值?

拉夫

我对编程很陌生,似乎无法解决以下数据提取问题。

这就是我的数据的样子(黄色 = 我要提取的数据):

看图片

提取标题、价格和时间工作正常:

# Title
advertTitle = firstAdvert.find_all(
"section", {"class": "aditem-main"})[0].find("h2").text.encode("utf-8").strip().replace("\n", "")

# Price
advertPrice = firstAdvert.find_all(
"section", {"class": "aditem-details"})[0].find("strong").text.encode("utf-8").strip().replace("\n", "")

# Time
advertTimeAdded = advertTitle = firstAdvert.find_all(
"section", {"class": "aditem-addon"})[0].text.encode("utf-8").strip().replace("\n", "")

但我的主要问题是:我将如何从中提取“ 79924470 ”:

<article class="aditem" data-adid="79924470">

我尝试过例如:

item.find_all("article", "data-adid"}

感谢您为我指明正确的方向!

马丁·埃文斯

可以使用一系列选择来获取各种元素,如下所示:

from bs4 import BeautifulSoup

soup = BeautifulSoup(html, "lxml")
print soup.article['data-adid']
image = soup.select('div.imagebox.srpimagebox')[0]
print image['data-href']
print image['data-imgsrc']
print soup.select('section h2 a')[0].text
print ', '.join([v.strip() for v in soup.select('section.aditem-details')[0].text.strip().split('\n')])
print soup.select('section.aditem-addon')[0].get_text(strip=True)

其中显示:

79924470
/ref/79924470
https://imgserver.com/012004.JPG
I am a title
12.380€, 50111, Cityname, 25km
Today, 16:19

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

从Beautifulsoup标签提取src

来自分类Dev

使用BeautifulSoup提取<a>标签

来自分类Dev

从Beautifulsoup标签提取src

来自分类Dev

使用BeautifulSoup提取相似的XML标签值

来自分类Dev

如何从BeautifulSoup中提取表值

来自分类Dev

如何使用BeautifulSoup访问标签的属性值

来自分类Dev

BeautifulSoup:如何提取没有标签的text子元素?

来自分类Dev

如何使用BeautifulSoup在html注释标签中提取json?

来自分类Dev

如何使用Python BeautifulSoup提取td HTML标签?

来自分类Dev

如何使用BeautifulSoup提取包含特定文本的div标签的内容

来自分类Dev

<br>标签内的Beautifulsoup提取

来自分类Dev

使用BeautifulSoup提取<span> WITH标签

来自分类Dev

从Beautifulsoup的“提取”标签中提取内容

来自分类Dev

如何使用BeautifulSoup提取<ul class = ...>下的<li>下的值

来自分类Dev

如何使用BeautifulSoup提取名称中的值?

来自分类Dev

如何检索属于字典类型的BeautifulSoup标签文本的键的“值”?

来自分类Dev

BeautifulSoup:如何提取内容?

来自分类Dev

从标签beautifulsoup python中提取类名

来自分类Dev

与beautifulsoup BR标签之间提取数据

来自分类Dev

使用beautifulsoup提取没有标签的文本

来自分类Dev

使用BeautifulSoup提取标签内的文本

来自分类Dev

从BeautifulSoup标签元素中提取文本

来自分类Dev

python beautifulsoup 提取标签间出现次数

来自分类Dev

如何使用Python BeautifulSoup提取xml文档中的标签偏移量

来自分类Dev

如何使用python和BeautifulSoup在xml中提取父元素的标签

来自分类Dev

BeautifulSoup-如何在标签之间提取字符串的子字符串?

来自分类Dev

Python & BeautifulSoup 初学者:如何从这段代码中提取标签

来自分类Dev

BeautifulSoup:如何提取封装在多个 div/span/id 标签中的文本

来自分类Dev

如何使用Python在BeautifulSoup中的同一div中提取具有相同标签的元素?

Related 相关文章

  1. 1

    从Beautifulsoup标签提取src

  2. 2

    使用BeautifulSoup提取<a>标签

  3. 3

    从Beautifulsoup标签提取src

  4. 4

    使用BeautifulSoup提取相似的XML标签值

  5. 5

    如何从BeautifulSoup中提取表值

  6. 6

    如何使用BeautifulSoup访问标签的属性值

  7. 7

    BeautifulSoup:如何提取没有标签的text子元素?

  8. 8

    如何使用BeautifulSoup在html注释标签中提取json?

  9. 9

    如何使用Python BeautifulSoup提取td HTML标签?

  10. 10

    如何使用BeautifulSoup提取包含特定文本的div标签的内容

  11. 11

    <br>标签内的Beautifulsoup提取

  12. 12

    使用BeautifulSoup提取<span> WITH标签

  13. 13

    从Beautifulsoup的“提取”标签中提取内容

  14. 14

    如何使用BeautifulSoup提取<ul class = ...>下的<li>下的值

  15. 15

    如何使用BeautifulSoup提取名称中的值?

  16. 16

    如何检索属于字典类型的BeautifulSoup标签文本的键的“值”?

  17. 17

    BeautifulSoup:如何提取内容?

  18. 18

    从标签beautifulsoup python中提取类名

  19. 19

    与beautifulsoup BR标签之间提取数据

  20. 20

    使用beautifulsoup提取没有标签的文本

  21. 21

    使用BeautifulSoup提取标签内的文本

  22. 22

    从BeautifulSoup标签元素中提取文本

  23. 23

    python beautifulsoup 提取标签间出现次数

  24. 24

    如何使用Python BeautifulSoup提取xml文档中的标签偏移量

  25. 25

    如何使用python和BeautifulSoup在xml中提取父元素的标签

  26. 26

    BeautifulSoup-如何在标签之间提取字符串的子字符串?

  27. 27

    Python & BeautifulSoup 初学者:如何从这段代码中提取标签

  28. 28

    BeautifulSoup:如何提取封装在多个 div/span/id 标签中的文本

  29. 29

    如何使用Python在BeautifulSoup中的同一div中提取具有相同标签的元素?

热门标签

归档