如何使用python从网络浏览器获取内容?

raghava.nitk

我有一个网页:http : //kff.org/womens-health-policy/state-indicator/ultrasound-requirements/#,我需要从该网页中提取表格。

遇到的问题:我一直在使用BeautifulSoup并请求获取url内容。这些方法的问题在于,即使在生成表之前,我也能够获取Web内容。

所以我得到了空表<table> <thead> </ thead> <tbody> </ tbody> </ table>

我的方法:现在,我尝试使用webbrowser.open_new_tab(url)在浏览器中打开url,然后直接从浏览器获取内容。这将使服务器更新表,然后我将能够从页面获取内容。

问题:我不确定如何直接从Web浏览器中获取信息。

现在我在Windows系统上使用Mozilla。

找到最近的链接网站但是它给出了打开哪些站点而不是内容

还有其他方法可以让表加载到urllib2或beautifulsoup和请求中吗?或者有什么方法可以直接从网页获取加载的内容。

谢谢

恐龙龙

要添加到Santiclause答案中,如果要抓取Java脚本填充的数据,则需要执行一些操作。

为此,您可以使用selenium程序包和诸如Firefox或PhantomJS(无头)之类的网络驱动程序来连接到页面,执行脚本并获取数据。

您的案例示例:

from selenium import webdriver
driver = webdriver.Firefox() # You can replace this with other web drivers
driver.get("http://kff.org/womens-health-policy/state-indicator/ultrasound-requirements/#")
source = driver.page_source # Here is your populated data.
driver.quit() # don't forget to quit the driver!

当然,如果您可以访问提到的Santiclause用户之类的直接json,则应该这样做。您可以通过在检查网站上的元素时检查“网络”选项卡来找到它,这需要一些操作。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何从网络浏览器获取列

来自分类Dev

如何从python的网络浏览器捕获HTTP错误

来自分类Dev

如何使用“网络浏览器应用程序”?

来自分类Dev

如何使用网络浏览器从具有URL的网站上获取网页?

来自分类Dev

如何制作网络浏览器?

来自分类Dev

Python for循环,网络浏览器

来自分类Dev

如何在网络浏览器字符串中使用Python占位符

来自分类Dev

如何在网络浏览器中获取“所见即所得”(打印所见内容)?

来自分类Dev

网络浏览器获取CSS和JavaScript文件

来自分类Dev

从网络浏览器获取 Django 下载附件

来自分类Dev

目标C:如何从网络浏览器获取可可应用的访问令牌?

来自分类Dev

如何从网络浏览器获取唯一的PC ID

来自分类Dev

如何使用网络浏览器连接到SFTP服务器?

来自分类Dev

如何确定我的网络浏览器是否安全?

来自分类Dev

如何制作批处理网络浏览器?

来自分类Dev

在线 Python IDE 中的网络浏览器问题

来自分类Dev

使用JavaScript最小化网络浏览器

来自分类Dev

Python关闭时如何退出网络浏览器会话?

来自分类Dev

如何使用网络浏览器作为VNC客户端?

来自分类Dev

如何使用网络浏览器的后退按钮?在Java Web应用程序中

来自分类Dev

如何启动故障安全图形会话?(使用鼠标和网络浏览器)

来自分类Dev

如何在网络浏览器中使用 lotusscript 按钮?

来自分类Dev

网络浏览器执行流程

来自分类Dev

更改网络浏览器光标

来自分类Dev

strace vs网络浏览器

来自分类Dev

Webhttrack 默认网络浏览器

来自分类Dev

网络浏览器:连接被拒绝

来自分类Dev

浏览器如何工作于现代网络浏览器

来自分类Dev

通过网络浏览器保存后如何使用lotus notes值在网络中显示输入字段?

Related 相关文章

  1. 1

    如何从网络浏览器获取列

  2. 2

    如何从python的网络浏览器捕获HTTP错误

  3. 3

    如何使用“网络浏览器应用程序”?

  4. 4

    如何使用网络浏览器从具有URL的网站上获取网页?

  5. 5

    如何制作网络浏览器?

  6. 6

    Python for循环,网络浏览器

  7. 7

    如何在网络浏览器字符串中使用Python占位符

  8. 8

    如何在网络浏览器中获取“所见即所得”(打印所见内容)?

  9. 9

    网络浏览器获取CSS和JavaScript文件

  10. 10

    从网络浏览器获取 Django 下载附件

  11. 11

    目标C:如何从网络浏览器获取可可应用的访问令牌?

  12. 12

    如何从网络浏览器获取唯一的PC ID

  13. 13

    如何使用网络浏览器连接到SFTP服务器?

  14. 14

    如何确定我的网络浏览器是否安全?

  15. 15

    如何制作批处理网络浏览器?

  16. 16

    在线 Python IDE 中的网络浏览器问题

  17. 17

    使用JavaScript最小化网络浏览器

  18. 18

    Python关闭时如何退出网络浏览器会话?

  19. 19

    如何使用网络浏览器作为VNC客户端?

  20. 20

    如何使用网络浏览器的后退按钮?在Java Web应用程序中

  21. 21

    如何启动故障安全图形会话?(使用鼠标和网络浏览器)

  22. 22

    如何在网络浏览器中使用 lotusscript 按钮?

  23. 23

    网络浏览器执行流程

  24. 24

    更改网络浏览器光标

  25. 25

    strace vs网络浏览器

  26. 26

    Webhttrack 默认网络浏览器

  27. 27

    网络浏览器:连接被拒绝

  28. 28

    浏览器如何工作于现代网络浏览器

  29. 29

    通过网络浏览器保存后如何使用lotus notes值在网络中显示输入字段?

热门标签

归档