Python RegEx-단어 안에 하이픈이 포함 된 정규식을 어떻게 구성합니까?

debugcn 에 게시 Dev

크리 티카 라그 하 벤드 란

http://domain.com/articles/page-number 와 같은 더 큰 URL의 일부로 "/ page-2"또는 "/ page-3"과 일치하는 정규 표현식이 필요합니다.

지금까지 다음 조합을 시도했습니다. '/ page- \ d' '/ page- \ d' '\ b / page- \ d \ b'

Scrapy 프로젝트의 start_urls 섹션에있는 규칙의 일부로 정규식을 사용하고 있습니다. 많은 제안을 주셔서 감사합니다. 다음은 코드 스 니펫입니다.

class NdtvXoloNewsItem(CrawlSpider):
    name = "ndtvxolonews"
    allowed_domains = ["http://gadgets.ndtv.com/tags/"]
    start_urls = ["http://gadgets.ndtv.com/tags/xolo/articles"]
    rules = [Rule(LinkExtractor(allow=['\b/page\-\d\b']))]

안 지모

allowed_domains도메인 이름이어야합니다. RegEx에 URL의 시작을 포함하여 특정 경로로 필터링 할 수 있습니다.

class NdtvXoloNewsItem(CrawlSpider):
    name = "ndtvxolonews"
    allowed_domains = ["gadgets.ndtv.com"]
    start_urls = ["http://gadgets.ndtv.com/tags/xolo/articles"]
    rules = [Rule(LinkExtractor(allow=['http://gadgets.ndtv.com/tags/.*/page\-\d+']))]

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-06-3

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

Python RegEx-단어 안에 하이픈이 포함 된 정규식을 어떻게 구성합니까?

Python RegEx-단어 안에 하이픈이 포함 된 정규식을 어떻게 구성합니까?

sed를 사용하여 하이픈이 포함 된 단어를 어떻게 분할 할 수 있습니까?

포함 된 JPanel이 포함 된 구성 요소에 모든 공간을 제공하려면 어떻게해야합니까?

하이픈이 포함 된 사용자 Azure AD 특성을 쿼리하려면 어떻게하나요?

구분 기호로 구분 된 단어 집합이 포함 된 문자열을 확인하는 정규식

Python에서 AWS CDK를 사용하여 두 가지 속성이 포함 된 SNS 구독 필터를 생성하려면 어떻게해야합니까?

Python : 단어 및 하이픈에 대한 정규식

여러 파일에서 단어가 포함 된 줄을 제거하려면 어떻게합니까?

하이픈이 포함 된 UUID 형식으로 문자열을 포맷하려면 어떻게해야합니까?

두 개 이상의 구 / 단어가 포함 된 파일을 어떻게 확인합니까?

Regex를 사용하여 문자열에 지정된 문자 집합 (순서 무시)이 포함되어 있는지 어떻게 확인할 수 있습니까?

문장을 분할하는 정규식 (하이픈이있는 단어 포함)

정확한 단어를 포함하는 구문을 찾는 Python 정규식

LINQ 식에 포함 된 테이블의 필드를 포함하려면 어떻게해야합니까?

Python에서 목록을 생성하는 동안 하이픈으로 연결된 단어를 무시하는 방법은 무엇입니까?

Windows 7에서 단어 또는 구문 (XP의 "개"검색 도우미)이 포함 된 파일을 어떻게 검색합니까?

특정 단어에 포함되지 않은 문자를 일치시키기 위해 정규식을 사용하려면 어떻게해야합니까?

Vimperator를 사용하여 제목이나 URL에 특정 단어가 포함 된 모든 탭을 닫으려면 어떻게해야합니까?

URL에 특정 단어가 포함 된 웹 페이지의 URL을 인쇄하는 정규식

내 세트에 모든 단어가 포함 된 Wikipedia 페이지를 검색하려면 어떻게합니까

Python에서 여러 수준의 사전이 포함 된 목록이있는 데이터 프레임을 어떻게 생성합니까?

fastparse에서 인용 된 정규식을 구문 분석하기 위해 구문 분석기를 구성하려면 어떻게해야합니까?

단어에 일부 문자가 포함 된 경우 정규 표현식은 다른 문자 패턴을 포함하지 않아야합니다.

하이픈이없는 단어에 대한 정규식 일치-Python

html 태그에 잘못된 속성을 포함하면 어떻게됩니까?

어떻게 포함 된 레이아웃 안에 안드로이드 이미지 뷰의 가시성을 설정하는 방법?

데비안에서 프로그램이 포함 된 패키지를 어떻게 찾을 수 있습니까?

공백이 포함 된 이름으로 미디어 파일을 생성하려면 어떻게합니까?

일부 단어에 공백이 포함 된 경우 파이썬 정규식

특정 단어가 포함 된 줄에 도달 할 때까지 줄 범위를 어떻게 선택합니까?