在Scrapy中,我想抓取一些具有大.zip文件的页面,并检索有关这些文件的一些数据(大小,URL等)。我可以执行此操作的一种方法是产生对这些url的请求,但我认为这会下载文件。如何仅从zip的URL中获取标头?最好不要抓取我想要标题的URL,而以其他方式检索它?
yield Request(url, method="HEAD", callback=self.callback)
然后,在回调中,从中读取标头response.headers
:
def callback(self, response):
print response.headers
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句