爬虫爬网占用大量CPU

debugcn 发表于 Dev

斯拉万

我有多个蜘蛛在多个实例（4）中并行运行。他们都使用几乎100％的CPU使用率。

我已经使用scrapyd部署了它们。尝试将scrapyd设置（例如max_concurrent_requests，CONCURRENT_REQUESTS，CONCURRENT_REQUESTS_PER_DOMAIN）更改为最小但没有运气。

我正在使用python 2.7.5和scrapy 0.24

我已经在Google上寻找解决方案，并找到了此页面

https://groups.google.com/forum/#!topic/scrapy-users/Rgq07ldcoPs

我找不到他们的解决方案

提前致谢

斯拉万

解决了这个问题。问题是频繁的Mysql更新，最终导致CPU负载。在管道中引入了微小的延迟以减少负载，从而解决了整个问题。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-8

我来说两句

0条评论

登录后参与评论

来自分类Dev

爬虫爬网占用大量CPU

来自分类Dev

占用大量CPU资源的解析

来自分类Dev

占用大量CPU的从属属性

来自分类Dev

RxJava sample（）占用大量CPU

来自分类Dev

占用大量CPU资源的解析

来自分类Dev

SpriteKit占用大量CPU资源

来自分类Dev

爬虫蜘蛛，仅爬网一次

来自分类Dev

简单的C ++ SFML程序占用大量CPU

来自分类Dev

简单的C ++ SFML程序占用大量CPU

来自分类Dev

正在运行的线程占用大量CPU

来自分类Dev

kswapd0正在占用大量CPU

来自分类Dev

跟踪器进程占用大量CPU

来自分类Dev

SEO-如何在数据加载期间要求爬虫在爬网之前等待？

来自分类Dev

SEO-如何在数据加载期间要求爬虫在爬网之前等待？

来自分类Dev

Numpy点操作快速完成，但持续占用大量CPU时间

来自分类Dev

是什么导致mount.ntfs占用大量CPU？

来自分类Dev

Java多线程程序不占用大量CPU

来自分类Dev

爬网的基本规则

来自分类Dev

PHP Web爬网

来自分类Dev

使用scrapy爬网

来自分类Dev

爬网的“智能”方式

来自分类Dev

爬网的基本规则

来自分类Dev

尝试运行具有大量列的极其基本的 AWS-glue 爬网程序时出现“内部服务异常”

来自分类Dev

Web爬网语言：如何进行分页爬网？

来自分类Dev

Perl Web爬网框架

来自分类Dev

Scrapy嵌套页面爬网

来自分类Dev

控制/限制广泛爬网

来自分类Dev

Web爬网：XPath分页

来自分类Dev

爬网使用JavaScript的网站

Related 相关文章

文章