我想抓取仅支持帖子数据的网站。我想在所有请求的后数据中发送查询参数。如何实现呢?
可以使用scrapy的Request或FormRequest类发出POST请求。
另外,请考虑使用start_requests()
方法代替start_urls
属性。
例:
from scrapy.http import FormRequest
class myspiderSpider(Spider):
name = "myspider"
allowed_domains = ["www.example.com"]
def start_requests(self):
return [ FormRequest("http://www.example.com/login",
formdata={'someparam': 'foo', 'otherparam': 'bar'},
callback=self.parse) ]
希望能有所帮助。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句