Scrapy-从URL获取文件大小和类型,而无需下载文件?

假天青

在Scrapy中,我想抓取一些具有大.zip文件的页面,并检索有关这些文件的一些数据(大小,URL等)。我可以执行此操作的一种方法是产生对这些url的请求,但我认为这会下载文件。如何仅从zip的URL中获取标头?最好不要抓取我想要标题的URL,而以其他方式检索它?

ec

屈服请求并指定HEAD为方法:

yield Request(url, method="HEAD", callback=self.callback)

然后,在回调中,从中读取标头response.headers

def callback(self, response):
    print response.headers

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Scrapy-从URL获取文件大小和类型,而无需下载文件?

来自分类Dev

Scrapy - 无法下载文件

来自分类Dev

Scrapy 下载特定类型的文件

来自分类Dev

在 Scrapy 中使用 ItemLoaders() 下载文件

来自分类Dev

不要等待使用Scrapy下载文件

来自分类Dev

Scrapy Shell和Scrapy Splash

来自分类Dev

Scrapy Files Pipeline 中的“文件(代码:302):下载文件时出错”

来自分类Dev

使用Scrapy从网站查找和下载pdf文件

来自分类Dev

使用scrapy抓取后如何压缩和清理下载的文件

来自分类Dev

获取远程URL的文件大小,而无需在Google App Engine(php)中下载

来自分类Dev

Objective-c从URL检查文件大小而无需下载

来自分类Dev

下载scrapy的整页

来自分类Dev

Python和Scrapy:Scrapy版本的问题

来自分类Dev

使用Scrapy获取MIME类型

来自分类Dev

获取Scrapy Logger

来自分类Dev

通过Scrapy获取“ ParseError”

来自分类Dev

Scrapy Python更改URL

来自分类Dev

PHP检查下载链接,而无需下载文件

来自分类Dev

Scrapy和Selenium StaleElementReferenceException

来自分类Dev

Scrapy和Javascript

来自分类Dev

Scrapy和Gearman

来自分类Dev

Scrapy CSV文件格式错误

来自分类Dev

Scrapy中的空.json文件

来自分类Dev

scrapy 返回空的 json 文件

来自分类Dev

使用scrapy管道写入文件

来自分类Dev

Scrapy:如何从设置文件设置scrapy start_urls?

来自分类Dev

从服务器上载和下载文件而无需提供密码

来自分类Dev

无需下载即可获取URL的文件大小

来自分类Dev

Scrapy:图片管道,下载图片