Scrapy로 시작 요청을받는 동안 오류가 발생했습니다.

debugcn 에 게시 Dev

이스마엘

이 두 특정 페이지를 긁어내는 데 문제가 있으며 문제가 어디에 있는지 실제로 알지 못합니다. 아이디어 나 조언이 있으면 모두 귀입니다! 미리 감사드립니다!

import scrapy


class SneakersSpider(scrapy.Spider):
    name = "sneakers"
    
    def start_requests(self):
        headers = {'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36'}
        urls = [ 
            #"https://stockx.com/fr-fr/retro-jordans",
            "https://stockx.com/fr-fr/retro-jordans?page=2",
            "https://stockx.com/fr-fr/retro-jordans?page=3",
            ]
        for url in urls:
            yield scrapy.Request(url = url, callback =self.parse ,headers = headers)
            
    def parse(self,response):
        page = response.url.split("=")[-1]
        filename = f'sneakers-{page}.html'
        with open(filename, 'wb') as f:
            f.write(response.body)
        self.log(f'Saved file {filename}')

낯선 사람

트레이스 백을 보면 항상 도움이됩니다. 스파이더의 출력에 다음과 같은 내용이 표시되어야합니다.

Traceback (most recent call last):
  File "c:\program files\python37\lib\site-packages\scrapy\core\engine.py", line 127, in _next_request
    request = next(slot.start_requests)
  File "D:\Users\Ivan\Documents\Python\a.py", line 15, in start_requests
    yield scrapy.Request(url = url, callback =self.parse ,headers = headers)
  File "c:\program files\python37\lib\site-packages\scrapy\http\request\__init__.py", line 39, in __init__
    self.headers = Headers(headers or {}, encoding=encoding)
  File "c:\program files\python37\lib\site-packages\scrapy\http\headers.py", line 12, in __init__
    super(Headers, self).__init__(seq)
  File "c:\program files\python37\lib\site-packages\scrapy\utils\datatypes.py", line 193, in __init__
    self.update(seq)
  File "c:\program files\python37\lib\site-packages\scrapy\utils\datatypes.py", line 229, in update
    super(CaselessDict, self).update(iseq)
  File "c:\program files\python37\lib\site-packages\scrapy\utils\datatypes.py", line 228, in <genexpr>
    iseq = ((self.normkey(k), self.normvalue(v)) for k, v in seq)
ValueError: too many values to unpack (expected 2)

보시다시피 요청 헤더를 처리하는 코드에 문제가 있습니다.

headers코드의 집합입니다. 대신 dict이어야합니다.
이것은 문제없이 작동합니다.

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36'}

모든 요청에 대해 기본 사용자 에이전트를 설정하는 또 다른 방법은 설정을 사용하는 것 USER_AGENT입니다.

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-5

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

Scrapy로 시작 요청을받는 동안 오류가 발생했습니다.

Scrapy로 시작 요청을받는 동안 오류가 발생했습니다.

Scrapy : 시작 요청을받는 동안 오류가 발생했습니다.

FreeIPA 서버를 Docker 컨테이너로 시작하는 동안 오류가 발생했습니다.

gulp 프로세스를 시작하는 동안 오류가 발생했습니다.

Gatsby 오류 [HPM] localhost : 8000에서 http : // localhost : 4000으로 프록시 요청을 시도하는 동안 오류가 발생했습니다 (ECONNREFUSED).

Yeoman 생성기를 시작하는 동안 오류가 발생했습니다.

React에서 Node로 게시 요청을 보내려고 할 때 프록시 요청 오류가 발생했습니다. 프록시가 요청을받을 때 제대로 작동합니다.

SQL 개발자로부터 프로 시저를 실행하는 동안 오류가 발생했습니다.

Glassfish를 시작하는 동안 오류가 발생했습니다 (errno = 22).

drbd 서비스를 시작하는 동안 오류가 발생했습니다.

namenode 및 datanode를 시작하는 동안 오류가 발생했습니다.

Kafka를 시작하는 동안 오류가 발생했습니다.

작성 파일을 kubernetes 매니페스트로 변환하는 동안 오류가 발생했습니다.

조건부로 문자열 형식을 다시 지정하는 동안 오류가 발생했습니다.

npm이 sass-loader 오류를 받기 시작하는 동안 오류가 발생했습니다.

각도로 Autodesk Forge 뷰어 확장을 작성하는 동안 오류가 발생했습니다.

Windows에서 Hadoop 2.6.0으로 작업을 제출하는 동안 오류가 발생했습니다.

시스템 시작시 WPF 응용 프로그램을 시작하는 동안 오류가 발생했습니다.

; [HPM] 프록시 요청을 시도하는 동안 오류가 발생했습니다.

PL / pgSQL 저장 프로 시저에 배열을 전달하는 동안 오류가 발생했습니다.

flutter에서 get 요청을 시도하는 동안 오류가 발생했습니다.

flutter에서 get 요청을 시도하는 동안 오류가 발생했습니다.

저장 프로 시저에서 varchar를 숫자로 변환하는 동안 오류가 발생했습니다.

OpenShift : 로컬 창 7 시스템에서 openshift로 복사하는 동안 오류가 발생했습니다.

스플래시를 조각으로로드하는 동안 오류가 발생했습니다.

Android에서 사용자 정의 대화 상자로 작업하는 동안 오류가 발생했습니다.

RecyclerView를 확장하는 동안 오류가 발생했습니다. 활동을 시작할 수 없습니다.

Spring Boot Kafka 프로젝트를 응시하는 동안 오류가 발생했습니다.

저장 프로 시저를 실행하는 동안 오류가 발생했습니다.

Tastypie로 관계형 데이터를 게시하는 동안 오류가 발생했습니다.