可以请求python库强制页面在存储该页面的内容之前加载所有javascript动态内容

吉塞里

Beautifulsoup通常可用于(1)将页面的内容存储在变量中,以及(2)解析网页中的元素。

但是,Beautifulsoup本身无法打开-受密码保护的HTTP错误403页。因此,我将请求用于此任务。

现在,我想知道Requests库是否可以强制加载页面上的javascript?

我正在使用python2.7

请求是否具有request.open(某些URL).forceJavascriptLoad的功能

马克斯·特普基夫(Max Tepkeev)

否。请求无法以任何方式执行javascript。您需要一个所谓的“无头” Web浏览器来完成所需的操作。是其中一些的清单。作为建议,我建议您尝试使用PhantomJS,尽管它不是用Python编写的,但与其他的相比它具有一些优点:

  1. 易于设置和使用
  2. 积极开发,并未像其他许多无头浏览器一样被抛弃
  3. 具有非常好的JavaScript支持
  4. 提供预编译的二进制文件,以防您在编译时遇到问题

我自己尝试了很多无头浏览器,但我对PhantomJS感到很满意。如果您仍然想尝试基于Python的无头浏览器,可以尝试Ghost

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

可以请求python库强制页面在存储该页面的内容之前加载所有javascript动态内容

来自分类Dev

ASPX页面的动态内容

来自分类Dev

HTML 按钮在页面的其他内容之前加载

来自分类Dev

我如何获得该页面的内容?

来自分类Dev

如何使用Chrome扩展程序在页面加载之前隐藏所有内容

来自分类Dev

Ionic 2:无法滚动页面的所有内容

来自分类Dev

页面加载Javascript之前无法添加到DOM内容

来自分类Dev

创建一个独立的html页面,该页面显示文件夹中所有文件的内容

来自分类Dev

页面动态加载内容时如何运行javascript函数

来自分类Dev

Wordpress 页面加载但所有内容不可见

来自分类Dev

使用Javascript加载内容,但仍保留指向特定内容页面的唯一链接

来自分类Dev

在 html 页面内加载动态内容

来自分类Dev

页面显示数据库中的所有内容

来自分类Dev

强制页面预加载器出现在任何内容之前

来自分类Dev

动态加载页面的python web抓取

来自分类Dev

如何使用无限滚动加载和解析动态页面的全部内容

来自分类Dev

将页面包含到index.php或创建页面的顶部和底部,并包含到所有内容页面?

来自分类Dev

Joomla插件在输出之前获取整个页面的内容

来自分类Dev

如何动态更新其他页面的内容

来自分类Dev

Dokuwiki-如何动态更改可见页面的内容

来自分类Dev

如果在渲染过程中该页面最终抛出该页面,是否可以跳过该页面的创建?

来自分类Dev

JS加载后获取页面的HTML内容

来自分类Dev

内容安全策略:页面的设置阻止了加载

来自分类Dev

Ajax加载同一页面的内容

来自分类Dev

dompdf,将Wordpress页面的内容存储在变量中

来自分类Dev

wordpress-如何将所有web内容和页面的webservice与android app集成

来自分类Dev

如何在融合宏中呈现页面的所有子级内容

来自分类Dev

使用Polymer缩小所有页面内容

来自分类Dev

使用Polymer缩小所有页面内容

Related 相关文章

  1. 1

    可以请求python库强制页面在存储该页面的内容之前加载所有javascript动态内容

  2. 2

    ASPX页面的动态内容

  3. 3

    HTML 按钮在页面的其他内容之前加载

  4. 4

    我如何获得该页面的内容?

  5. 5

    如何使用Chrome扩展程序在页面加载之前隐藏所有内容

  6. 6

    Ionic 2:无法滚动页面的所有内容

  7. 7

    页面加载Javascript之前无法添加到DOM内容

  8. 8

    创建一个独立的html页面,该页面显示文件夹中所有文件的内容

  9. 9

    页面动态加载内容时如何运行javascript函数

  10. 10

    Wordpress 页面加载但所有内容不可见

  11. 11

    使用Javascript加载内容,但仍保留指向特定内容页面的唯一链接

  12. 12

    在 html 页面内加载动态内容

  13. 13

    页面显示数据库中的所有内容

  14. 14

    强制页面预加载器出现在任何内容之前

  15. 15

    动态加载页面的python web抓取

  16. 16

    如何使用无限滚动加载和解析动态页面的全部内容

  17. 17

    将页面包含到index.php或创建页面的顶部和底部,并包含到所有内容页面?

  18. 18

    Joomla插件在输出之前获取整个页面的内容

  19. 19

    如何动态更新其他页面的内容

  20. 20

    Dokuwiki-如何动态更改可见页面的内容

  21. 21

    如果在渲染过程中该页面最终抛出该页面,是否可以跳过该页面的创建?

  22. 22

    JS加载后获取页面的HTML内容

  23. 23

    内容安全策略:页面的设置阻止了加载

  24. 24

    Ajax加载同一页面的内容

  25. 25

    dompdf,将Wordpress页面的内容存储在变量中

  26. 26

    wordpress-如何将所有web内容和页面的webservice与android app集成

  27. 27

    如何在融合宏中呈现页面的所有子级内容

  28. 28

    使用Polymer缩小所有页面内容

  29. 29

    使用Polymer缩小所有页面内容

热门标签

归档