URL에 특정 단어가 포함 된 웹 페이지의 URL을 인쇄하는 정규식

debugcn 에 게시 Dev

체트 나 123

아래 코드를 사용하여 웹 페이지에서 URL을 추출하고 잘 작동하지만 필터링하고 싶습니다. 해당 페이지의 모든 URL을 표시하지만 "super"라는 단어로 구성된 URL 만 원합니다.

     $regex='|<a.*?href="(.*?)"|';
preg_match_all($regex,$result,$parts);
$links=$parts[1];
foreach($links as $link){
echo $link."<br>";

       }

따라서 super라는 단어가있는 uls 만 에코해야합니다. 예를 들어 URL을 무시해야합니다.

       http://xyz.com/abc.html

그러나 그것은 에코되어야한다

        http://abc.superpower.com/hddll.html

URL에 super라는 필수 단어로 구성되어 있으므로

아누 바바

정규식을 탐욕스럽지 않게 만드십시오.

$regex = '|<a.*?href="(.*?super[^"]*)"|is';

그러나 HTML을 구문 분석하고 스크랩하려면 PHP의 DOM 구문 분석기를 사용하는 것이 좋습니다.

업데이트 : 다음은 DOM 파서를 사용하는 코드입니다.

$request_url ='1900girls.blogspot.in/';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $request_url);    
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); 
$result = curl_exec($ch);

$doc = new DOMDocument();
libxml_use_internal_errors(true);
$doc->loadHTML($result); // loads your html
$xpath = new DOMXPath($doc);
$needle = 'blog';

$nodelist = $xpath->query("//a[contains(@href, '" . $needle . "')]");
for($i=0; $i < $nodelist->length; $i++) {
    $node = $nodelist->item($i);
    echo $node->getAttribute('href') . "\n";
}

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-05-29

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

URL에 특정 단어가 포함 된 웹 페이지의 URL을 인쇄하는 정규식

URL에 특정 단어가 포함 된 웹 페이지의 URL을 인쇄하는 정규식

업데이트 : 다음은 DOM 파서를 사용하는 코드입니다.

특정 단어가 포함 된 HTML 페이지에서 줄의 색상을 변경하는 방법

정규식을 사용하여 특정 단어가 포함 된 블록 찾기

정규식을 사용하여 Notepad ++에서 특정 키워드가 포함 된 전체 단어 검색

정규식을 사용하여 Notepad ++에서 특정 키워드가 포함 된 전체 단어 검색

웹 페이지에 특정 텍스트가 포함 된 경우 URL 목록 만들기

확장자가없고 특정 단어가 포함 된 URL 일치에 대한 정규식

문자열에 지정된 단어가 포함되어 있는지 확인해야하는 정규식

http가 아닌 특수 URL (Python / Django)에 포함 된 URL의 Cache-Control을 설정하는 방법

인스턴스 이름에 특정 단어가 포함 된 영화 클립을 제거하는 방법

정규식 : 링크에서이 특정 단어를 포함하지 않는 HTML 페이지를 찾습니다.

특정 단어를 포함하지 않는 줄을 찾는 정규 표현식

Vimperator를 사용하여 제목이나 URL에 특정 단어가 포함 된 모든 탭을 닫으려면 어떻게해야합니까?

Excel에서 특정 단어가 포함 된 셀 값을 에코하는 방법

awk 특정 필드에 특정 번호가 포함 된 경우 전체 줄을 인쇄하는 한 줄

특정 단어가 포함 된 URL 만 다운로드

정규식 확인 문자열에 지정된 것 이외의 문자가 포함되어 있는지 여부

정규식 확인 문자열에 지정된 것 이외의 문자가 포함되어 있는지 여부

단어에 일부 문자가 포함 된 경우 정규 표현식은 다른 문자 패턴을 포함하지 않아야합니다.

Python RegEx-단어 안에 하이픈이 포함 된 정규식을 어떻게 구성합니까?

구분 기호로 구분 된 단어 집합이 포함 된 문자열을 확인하는 정규식

특정 단어가 포함 된 모든 행을 정확히 k 번 인쇄

정규식 : 특정 태그에 3 자 미만의 문자가 포함 된 단어를 선택하고 삭제합니다.

Gmail의 제목이나 본문에 특정 단어가 포함 된 경우 이메일에 레이블을 지정하는 스크립트

특수 문자로 시작하는 단어가 포함 된 정규식 \ b

정규식을 사용하여 특정 단어 패턴이없는 URL 찾기

ajax 검색 특정 구문에 검색된 단어가 포함되어 있는지 확인하는 방법

URL에 특정 단어가 포함되어 있는지 확인한 다음 표시

URL이 특정 URL로 시작하고 특정 매개 변수도 포함하는지 확인하기 위해 Google Analytics에 대한 정규 표현식 작성

정규식을 사용하여 쉼표가 포함 된 단어 앞의 모든 항목과 일치