我正在尝试使用beautifulsoup进行一些非常简单的网络抓取,并且正在使用request.get命令从网站中获取HTML数据。但是,从这个给定的网站来看,我的内核似乎无法处理请求,并且我的内核陷入了困境。有人曾经历过此事并找到了解决方案吗?
我只是尝试以下方法:
r = request.get('http://www.nasdaqomxnordic.com/etp/leverage-certifikat/info?Instrument=CSE192562')
问题是,此网站需要加载一些标头,您可以在请求中传递这些标头
如
>>>requests.get('http://www.nasdaqomxnordic.com/etp/leverage-certifikat/info?Instrument=CSE192562', headers={"User-Agent": "Mozilla/5.0 (X11; CrOS x86_64 12871.102.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.141 Safari/537.36"})
<Response [200]>
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句