爬虫爬网占用大量CPU

斯拉万

我有多个蜘蛛在多个实例(4)中并行运行。他们都使用几乎100%的CPU使用率。

我已经使用scrapyd部署了它们。尝试将scrapyd设置(例如max_concurrent_requests,CONCURRENT_REQUESTS,CONCURRENT_REQUESTS_PER_DOMAIN)更改为最小但没有运气。

我正在使用python 2.7.5和scrapy 0.24

我已经在Google上寻找解决方案,并找到了此页面

https://groups.google.com/forum/#!topic/scrapy-users/Rgq07ldcoPs

我找不到他们的解决方案

提前致谢

斯拉万

解决了这个问题。问题是频繁的Mysql更新,最终导致CPU负载。在管道中引入了微小的延迟以减少负载,从而解决了整个问题。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

爬虫爬网占用大量CPU

来自分类Dev

占用大量CPU资源的解析

来自分类Dev

占用大量CPU的从属属性

来自分类Dev

RxJava sample()占用大量CPU

来自分类Dev

占用大量CPU资源的解析

来自分类Dev

SpriteKit占用大量CPU资源

来自分类Dev

爬虫蜘蛛,仅爬网一次

来自分类Dev

简单的C ++ SFML程序占用大量CPU

来自分类Dev

简单的C ++ SFML程序占用大量CPU

来自分类Dev

正在运行的线程占用大量CPU

来自分类Dev

kswapd0正在占用大量CPU

来自分类Dev

跟踪器进程占用大量CPU

来自分类Dev

SEO-如何在数据加载期间要求爬虫在爬网之前等待?

来自分类Dev

SEO-如何在数据加载期间要求爬虫在爬网之前等待?

来自分类Dev

Numpy点操作快速完成,但持续占用大量CPU时间

来自分类Dev

是什么导致mount.ntfs占用大量CPU?

来自分类Dev

Java多线程程序不占用大量CPU

来自分类Dev

爬网的基本规则

来自分类Dev

PHP Web爬网

来自分类Dev

使用scrapy爬网

来自分类Dev

爬网的“智能”方式

来自分类Dev

爬网的基本规则

来自分类Dev

尝试运行具有大量列的极其基本的 AWS-glue 爬网程序时出现“内部服务异常”

来自分类Dev

Web爬网语言:如何进行分页爬网?

来自分类Dev

Perl Web爬网框架

来自分类Dev

Scrapy嵌套页面爬网

来自分类Dev

控制/限制广泛爬网

来自分类Dev

Web爬网:XPath分页

来自分类Dev

爬网使用JavaScript的网站