BeautifulSoup：如何提取标签值？

debugcn 发表于 Dev

拉夫

我对编程很陌生，似乎无法解决以下数据提取问题。

这就是我的数据的样子（黄色 = 我要提取的数据）：

提取标题、价格和时间工作正常：

# Title
advertTitle = firstAdvert.find_all(
"section", {"class": "aditem-main"})[0].find("h2").text.encode("utf-8").strip().replace("\n", "")

# Price
advertPrice = firstAdvert.find_all(
"section", {"class": "aditem-details"})[0].find("strong").text.encode("utf-8").strip().replace("\n", "")

# Time
advertTimeAdded = advertTitle = firstAdvert.find_all(
"section", {"class": "aditem-addon"})[0].text.encode("utf-8").strip().replace("\n", "")

但我的主要问题是：我将如何从中提取“ 79924470 ”：

<article class="aditem" data-adid="79924470">

我尝试过例如：

item.find_all("article", "data-adid"}

感谢您为我指明正确的方向！

马丁·埃文斯

可以使用一系列选择来获取各种元素，如下所示：

from bs4 import BeautifulSoup

soup = BeautifulSoup(html, "lxml")
print soup.article['data-adid']
image = soup.select('div.imagebox.srpimagebox')[0]
print image['data-href']
print image['data-imgsrc']
print soup.select('section h2 a')[0].text
print ', '.join([v.strip() for v in soup.select('section.aditem-details')[0].text.strip().split('\n')])
print soup.select('section.aditem-addon')[0].get_text(strip=True)

其中显示：

79924470
/ref/79924470
https://imgserver.com/012004.JPG
I am a title
12.380€, 50111, Cityname, 25km
Today, 16:19

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-15

我来说两句

0条评论

登录后参与评论

来自分类Dev

从Beautifulsoup标签提取src

来自分类Dev

使用BeautifulSoup提取<a>标签

来自分类Dev

从Beautifulsoup标签提取src

来自分类Dev

使用BeautifulSoup提取相似的XML标签值

来自分类Dev

如何从BeautifulSoup中提取表值

来自分类Dev

如何使用BeautifulSoup访问标签的属性值

来自分类Dev

BeautifulSoup：如何提取没有标签的text子元素？

来自分类Dev

如何使用BeautifulSoup在html注释标签中提取json？

来自分类Dev

如何使用Python BeautifulSoup提取td HTML标签？

来自分类Dev

如何使用BeautifulSoup提取包含特定文本的div标签的内容

来自分类Dev

<br>标签内的Beautifulsoup提取

来自分类Dev

使用BeautifulSoup提取<span> WITH标签

来自分类Dev

从Beautifulsoup的“提取”标签中提取内容

来自分类Dev

如何使用BeautifulSoup提取<ul class = ...>下的<li>下的值

来自分类Dev

如何使用BeautifulSoup提取名称中的值？

来自分类Dev

如何检索属于字典类型的BeautifulSoup标签文本的键的“值”？

来自分类Dev

BeautifulSoup：如何提取内容？

来自分类Dev

从标签beautifulsoup python中提取类名

来自分类Dev

与beautifulsoup BR标签之间提取数据

来自分类Dev

使用beautifulsoup提取没有标签的文本

来自分类Dev

使用BeautifulSoup提取标签内的文本

来自分类Dev

从BeautifulSoup标签元素中提取文本

来自分类Dev

python beautifulsoup 提取标签间出现次数

来自分类Dev

如何使用Python BeautifulSoup提取xml文档中的标签偏移量

来自分类Dev

如何使用python和BeautifulSoup在xml中提取父元素的标签

来自分类Dev

BeautifulSoup-如何在标签之间提取字符串的子字符串？

来自分类Dev

Python & BeautifulSoup 初学者：如何从这段代码中提取标签

来自分类Dev

BeautifulSoup：如何提取封装在多个 div/span/id 标签中的文本

来自分类Dev

如何使用Python在BeautifulSoup中的同一div中提取具有相同标签的元素？

Related 相关文章

文章