使用BeautifulSoup从HTML获取文本

机器人弓

我正在尝试使用Python2.7和BeautifulSoup4电力提供商网站获取当前的“ 5分钟趋势价格”

xpath是: xpath = "//html/body/div[2]/div/div/div[3]/p[1]"

要么

<div class="instant prices">
  <p class="price">
    "5.2"  # this is what I'm ultimately after
    <small>¢</small>
    <strong> per kWh </strong>
  </p>

我尝试了多种不同的方法来获取“ 5.2”值,并且成功地钻取了“即时价格”对象,但无法从中获得任何收益。

我当前的代码如下所示:从bs4导入urllib2导入BeautifulSoup

url = "https://rrtp.comed.com/live-prices/"

soup = BeautifulSoup(urllib2.urlopen(url).read())
#print soup

instantPrices = soup.findAll('div', 'instant prices')
print instantPrices

...的输出是:

[<div class="instant prices">
</div>]
[]

无论如何,即使我在Chrome浏览器中检查元素时也可以清楚地看到“即时价格”对象,但它似乎是空的。任何帮助将不胜感激!谢谢!

裂解酶

不幸的是,当浏览器渲染网站时,这些数据是通过Javascript生成的。这就是为什么当您使用urllib下载源代码时,此信息不存在的原因。您可以直接查询后端:

>>> import urllib2
>>> import re

>>> url = "https://rrtp.comed.com/rrtp/ServletFeed?type=instant"
>>> s = urllib2.urlopen(url).read()
"<p class='price'>4.5<small>&cent;</small><strong> per kWh </strong></p><p>5-minute Trend Price 7:40 PM&nbsp;CT</p>\r\n"

>>> float(re.findall("\d+.\d+", s)[0])
4.5

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用Python和BeautifulSoup解析HTML-在<a>标记内外获取文本

来自分类Dev

如何使用BeautifulSoup获取重定向HTML?

来自分类Dev

使用beautifulsoup从HTML获取链接文本

来自分类Dev

使用BeautifulSoup在html中获取链接

来自分类Dev

如何使用BeautifulSoup bs4获取HTML标签的内部文本值?

来自分类Dev

使用BeautifulSoup从html编辑文本

来自分类Dev

Python:使用Beautifulsoup从html获取文本

来自分类Dev

BeautifulSoup:获取课程文本

来自分类Dev

在使用BeautifulSoup忽略格式标签的同时,如何从html获取文本?

来自分类Dev

使用BeautifulSoup从Javascript提取文本以获取关注者数量

来自分类Dev

使用BeautifulSoup获取没有标签的文本

来自分类Dev

使用beautifulsoup从br标签获取文本

来自分类Dev

在Python中使用BeautifulSoup从HTML文本中的嵌套元素中获取文本

来自分类Dev

如何使用beautifulsoup从链接获取文本和URL

来自分类Dev

无法使用BeautifulSoup获取span属性的文本

来自分类Dev

我无法使用BeautifulSoup抓取HTML文本

来自分类Dev

使用BeautifulSoup无法在</ span>标记后立即获取文本

来自分类Dev

使用BeautifulSoup从<pre>元素获取文本

来自分类Dev

使用BeautifulSoup获取跨度中的跨度文本

来自分类Dev

获取跨度内的文本html beautifulSoup

来自分类Dev

使用BeautifulSoup从html表中获取数据

来自分类Dev

使用BeautifulSoup在HTML标记后获取文本

来自分类Dev

使用BeautifulSoup获取没有标签的文本?

来自分类Dev

BeautifulSoup获取文本链接?

来自分类Dev

使用 BeautifulSoup 获取 HTML 标签

来自分类Dev

使用 Beautifulsoup 时如何获取文本标记

来自分类Dev

无法使用 BeautifulSoup 从 html 获取日期

来自分类Dev

如何使用beautifulsoup从html中提取文本?

来自分类Dev

BeautifulSoup:无法获取文本

Related 相关文章

  1. 1

    使用Python和BeautifulSoup解析HTML-在<a>标记内外获取文本

  2. 2

    如何使用BeautifulSoup获取重定向HTML?

  3. 3

    使用beautifulsoup从HTML获取链接文本

  4. 4

    使用BeautifulSoup在html中获取链接

  5. 5

    如何使用BeautifulSoup bs4获取HTML标签的内部文本值?

  6. 6

    使用BeautifulSoup从html编辑文本

  7. 7

    Python:使用Beautifulsoup从html获取文本

  8. 8

    BeautifulSoup:获取课程文本

  9. 9

    在使用BeautifulSoup忽略格式标签的同时,如何从html获取文本?

  10. 10

    使用BeautifulSoup从Javascript提取文本以获取关注者数量

  11. 11

    使用BeautifulSoup获取没有标签的文本

  12. 12

    使用beautifulsoup从br标签获取文本

  13. 13

    在Python中使用BeautifulSoup从HTML文本中的嵌套元素中获取文本

  14. 14

    如何使用beautifulsoup从链接获取文本和URL

  15. 15

    无法使用BeautifulSoup获取span属性的文本

  16. 16

    我无法使用BeautifulSoup抓取HTML文本

  17. 17

    使用BeautifulSoup无法在</ span>标记后立即获取文本

  18. 18

    使用BeautifulSoup从<pre>元素获取文本

  19. 19

    使用BeautifulSoup获取跨度中的跨度文本

  20. 20

    获取跨度内的文本html beautifulSoup

  21. 21

    使用BeautifulSoup从html表中获取数据

  22. 22

    使用BeautifulSoup在HTML标记后获取文本

  23. 23

    使用BeautifulSoup获取没有标签的文本?

  24. 24

    BeautifulSoup获取文本链接?

  25. 25

    使用 BeautifulSoup 获取 HTML 标签

  26. 26

    使用 Beautifulsoup 时如何获取文本标记

  27. 27

    无法使用 BeautifulSoup 从 html 获取日期

  28. 28

    如何使用beautifulsoup从html中提取文本?

  29. 29

    BeautifulSoup:无法获取文本

热门标签

归档