吉塞里
Beautifulsoup通常可用于(1)将页面的内容存储在变量中,以及(2)解析网页中的元素。
但是,Beautifulsoup本身无法打开-受密码保护的HTTP错误403页。因此,我将请求用于此任务。
现在,我想知道Requests库是否可以强制加载页面上的javascript?
我正在使用python2.7
请求是否具有request.open(某些URL).forceJavascriptLoad的功能
马克斯·特普基夫(Max Tepkeev)
否。请求无法以任何方式执行javascript。您需要一个所谓的“无头” Web浏览器来完成所需的操作。这是其中一些的清单。作为建议,我建议您尝试使用PhantomJS,尽管它不是用Python编写的,但与其他的相比它具有一些优点:
- 易于设置和使用
- 积极开发,并未像其他许多无头浏览器一样被抛弃
- 具有非常好的JavaScript支持
- 快
- 提供预编译的二进制文件,以防您在编译时遇到问题
我自己尝试了很多无头浏览器,但我对PhantomJS感到很满意。如果您仍然想尝试基于Python的无头浏览器,可以尝试Ghost。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
编辑于
我来说两句