Scrapy Python设置用户代理

先生

我试图通过在项目配置文件中添加额外的一行来覆盖我的crawlspider的用户代理这是代码:

[settings]
default = myproject.settings
USER_AGENT = "Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1453.93 Safari/537.36"


[deploy]
#url = http://localhost:6800/
project = myproject

但是,当我在自己的Web上运行搜寻器时,我注意到Spider不会选择我自定义的用户代理,而是默认的“ Scrapy / 0.18.2(+ http://scrapy.org)”。谁能解释我做错了什么。

注意:

(1)。当我尝试全局覆盖用户代理时,它起作用

scrapy crawl myproject.com -o output.csv -t csv -s USER_AGENT="Mozilla...."

(2)。当我从配置文件中删除“ default = myproject.setting”行,并运行scrapy crawl myproject.com时,它说“找不到蜘蛛..”,因此我觉得这种情况下不应删除默认设置。

非常感谢您的事先帮助。

保罗·特姆布雷斯

将您的USER_AGENT行移至settings.py文件,而不是scrapy.cfg文件中。settings.py应该与items.py使用scrapy startproject命令处于同一级别,在这种情况下,它应该类似于myproject/settings.py

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

根据 Scrapy 中的 url 设置代理

来自分类Dev

Scrapy不更改代理

来自分类Dev

Scrapy:将用户代理更改与IP地址更改同步

来自分类Dev

Scrapy:将用户代理更改与IP地址更改同步

来自分类Dev

Scrapy:使用代理中间件设置错误

来自分类Dev

为scrapy设置Crontab

来自分类Dev

Scrapy:使用代理下载错误

来自分类Dev

Python和Scrapy:Scrapy版本的问题

来自分类Dev

scrapy python re语句

来自分类Dev

Python Scrapy什么也没做

来自分类Dev

Scrapy Python更改URL

来自分类Dev

Python/Scrapy - UnicodeDecodeError

来自分类Dev

Scrapy:如何从设置文件设置scrapy start_urls?

来自分类Dev

如何动态设置Scrapy规则?

来自分类Dev

新的上传设置Scrapy 0.26

来自分类Dev

新的上传设置Scrapy 0.26

来自分类Dev

如何使用Scrapy设置proxymesh?

来自分类Dev

Scrapy - 设置 TCP 连接超时

来自分类Dev

Scrapy-仅在ImagesPipeline上启用代理

来自分类Dev

在Scrapy上爬行时出现错误,用户代理无法正常工作

来自分类Dev

如何在scrapy shell中而不是在settings.py中设置代理

来自分类Dev

使用 scrapy-rotating-proxies 包手动将代理设置为死

来自分类Dev

在python scrapy中处理分页

来自分类Dev

Python Scrapy动态网站

来自分类Dev

从python脚本调用Scrapy Spider?

来自分类Dev

为Python 2.6安装Scrapy

来自分类Dev

python scrapy从网站提取数据

来自分类Dev

Scrapy的Python递归爬取

来自分类Dev

python和scrapy THE编码问题