我如何从带有美丽汤的单词汤中获取特定的词组?

0x

我已经用 BeautifulSoup 对我的代码进行了排序,并得出了这个:

<bound method Tag.prettify of <script type="text/javascript">var LifeTimeStats = [{"Key":"Top 3","Value":"31"},{"Key":"Top 5s","Value":"36"},{"Key":"Top 3s","Value":"13"},{"Key":"Top 6s","Value":"27"},{"Key":"Top 12s","Value":"76"},{"Key":"Top 25s","Value":"58"},{"Key":"Score","Value":"99,788"},{"Key":"Matches Played","Value":"502"},{"Key":"Wins","Value":"9"},{"Key":"Win%","Value":"2%"},{"Key":"Kills","Value":"730"},{"Key":"K/d","Value":"1.48"}];</script>>

我试图从中获得特定的值“730”

{"Key":"Kills","Value":"730"}

由于没有我可以排序的 HTML 标签。我不知道如何获得这个特定的价值。你有什么主意吗?

也许还有另一种解决方案......这是完整的代码:

#----WEB INPUT BASIC----

    #import bs4
    from urllib.request import urlopen as uReq
    from urllib.request import Request, urlopen
    from  bs4 import BeautifulSoup as soup


    #setting my url
    url = 'https://fortnitetracker.com/profile/psn/Rehgum'

    #making my https page work
    req = Request(url, headers={'User-Agent': 'Mozilla/5.0'})

    web_byte = urlopen(req).read()
    webpage = web_byte.decode('utf-8')
    urlopen(req).close()

    #html parsing
    page_soup = soup(webpage, "html.parser")

    lifetime = page_soup.findAll("script",{"type":"text/javascript"})

    stats = lifetime[3]

    specific = stats.prettify

    value = specific.text

    #from here there is just code to put that value in a .txt file
卡兹贝尔

这只是您可以做什么的一个想法:

  1. 将 JS 代码提取到 Python 变量中。
  2. 进行正则表达式操作以提取变量的值。
  3. “JSONify”这样的变量值。
  4. 提取您需要的数据。

作为摘录:

a = '''var LifeTimeStats = [{"Key":"Top 3","Value":"31"},{"Key":"Top 5s","Value":"36"},{"Key":"Top 3s","Value":"13"},{"Key":"Top 6s","Value":"27"},{"Key":"Top 12s","Value":"76"},{"Key":"Top 25s","Value":"58"},{"Key":"Score","Value":"99,788"},{"Key":"Matches Played","Value":"502"},{"Key":"Wins","Value":"9"},{"Key":"Win%","Value":"2%"},{"Key":"Kills","Value":"730"},{"Key":"K/d","Value":"1.48"}];'''

b = re.findall(r'var.*?=\s*(.*?);', a)[0]
c = json.loads(b)

请参阅我编写虚拟完整代码

更新

看到完整代码后...可能是您问题的解决方案。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在带有美丽汤的特定标签后获取文本

来自分类Dev

如何从列表中获取URL?美丽汤

来自分类Dev

从美丽的汤中获取标签“ a”

来自分类Dev

如何在我的美丽汤中删除分隔符“”

来自分类Dev

美丽的汤-获取所有元素

来自分类Dev

使用美丽汤获取href

来自分类Dev

美丽的汤-获取标签内容

来自分类Dev

美丽的汤,通过带有标签的标签内容进行搜索

来自分类Dev

如何在带有美丽汤的div中选择div类?

来自分类Dev

标签中的美丽汤标

来自分类Dev

标签中的美丽汤标

来自分类Dev

如何使用美丽汤从html页面获取链接网址

来自分类Dev

如何使用刮板中的每个项目使用“美丽的汤”获取链接文本?

来自分类Dev

如何从我需要的文本中跳过或截断字符或符号。用美丽的汤刮网

来自分类Dev

如何一次打印“美丽汤”的所有结果?

来自分类Dev

如何删除所有“ document.write('');” 和美丽的汤

来自分类Dev

如何使用美丽的汤列出在 html 文件中包含 PA/ 的所有字符串

来自分类Dev

如何禁用所有不在列表中的链接,使用美丽的汤

来自分类Dev

在美丽的汤中循环/没有错误

来自分类Dev

美丽的汤不刮页面中的所有元素

来自分类Dev

用美丽的汤提取表中的所有链接

来自分类Dev

如何在美丽的汤中引入容错能力

来自分类Dev

如何在美丽的汤中重命名课程

来自分类Dev

如何在美丽的汤中引入容错能力

来自分类Dev

用美丽的汤提取特定的链接

来自分类Dev

美丽的汤:从html获取文本数据

来自分类Dev

美丽的汤:从html获取图片大小

来自分类Dev

获取空内容美丽的汤Python

来自分类Dev

美丽的汤没有“得到”完整的网页

Related 相关文章

热门标签

归档