Python,美丽的汤,<br> 标签

索菲利亚

所以我查看了堆栈溢出,但似乎无法找到我的问题的答案。如何在 <br> 标签后获取文本、特定文本?

这是我的代码:

product_review_container = container.findAll("span",{"class":"search_review_summary"})
for product_review in product_review_container:
    prr = product_review.get('data-tooltip-html')
    print(prr)

这是输出:

Very Positive<br>86% of the 1,013 user reviews for this game are positive.

我只想要这个字符串中的 86% 和单独的 1,013。所以只有数字。但是它不是 int 所以我不知道该怎么做。

原文出处如下:

   [<span class="search_review_summary positive" data-tooltip-html="Very Positive&lt;br&gt;86% of the 1,013 user reviews for this game are positive.">
</span>]

这是我获取信息的链接:https : //store.steampowered.com/search/?specials=1&page=1

谢谢!

克里斯托夫·瓦尔加

你需要在这里使用正则表达式!

import re

string = 'Very Positive<br>86% of the 1,013 user reviews for this game are positive.'
a = re.findall('(\d+%)|(\d+,\d+)',string)
print(a)

output: [('86%', ''), ('', '1,013')]
#Then a[0][0] will be 86% and a[1][1] will be 1,013

其中 \d 是字符串中的任意数字字符,+ 表示至少有 1 位或更多位数字。

如果您需要更具体的正则表达式,则可以在https://regex101.com 中尝试

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Python-美丽的汤-删除标签

来自分类Dev

删除标签-美丽的汤

来自分类Dev

美丽汤元内容标签

来自分类Dev

美丽的汤遍历html标签

来自分类Dev

标签中的美丽汤标

来自分类Dev

从美丽的汤中获取标签“ a”

来自分类Dev

标签中的美丽汤标

来自分类Dev

美丽的汤-获取标签内容

来自分类Dev

标签内的美丽汤文本

来自分类Dev

美丽的汤返回标签和文本

来自分类Dev

使用<br>标签解析html(Python)

来自分类Dev

Python bs4删除br标签

来自分类Dev

Python bs4删除br标签

来自分类Dev

美丽的汤,通过带有标签的标签内容进行搜索

来自分类Dev

美丽的汤返回关闭标签而不是标签文本

来自分类Dev

jQuery删除BR标签

来自分类Dev

PHP删除BR标签

来自分类Dev

HTML BR标签控制

来自分类Dev

美丽的汤find_all()返回奇数标签而不是结果

来自分类Dev

美丽的汤只是获得标签内的价值

来自分类Dev

在带有美丽汤的特定标签后获取文本

来自分类Dev

使用正则表达式查找标签的美丽汤?

来自分类Dev

美丽的汤标签有冒号。需要提取温度值。

来自分类Dev

如何使用美丽的汤4从span标签提取文本?

来自分类Dev

Findall 到 div 标签使用美丽的汤产生空白返回

来自分类Dev

无法使用美丽的汤获得标签的价值

来自分类Dev

通过文本而不是标签在美丽的汤中查找项目

来自分类Dev

使用美丽的汤在 div 标签下进行网页抓取

来自分类Dev

用lxml,python,.tail解析的HTML被<br>标签分解