나는에서 추출 값에 펄 프로그램을 쓰고 있어요 <td>
그리고 <a href>
까지 </a>
가장 가능성이 난 후 그 결과 원하는 /domain/
HTML 소스 코드에서 언급 한 바와 같이합니다. 앞으로 이런 정보를 더 자주 사용해야하니 안내해주세요.
내 질문 : 내가 어디에서 잘못되고 왜? 많은 정규식 페이지를 읽었지만 전혀 도움이되지 않았습니다.
정규식 1 :
while ($response =~ m/<td><a href=\"\/domain\/(.*?)\/dns">(.*?)/g )
정규식 2 :
while($response =~ s/((?:href|domain))\=\"([^{].*?)/ig ) {
<td><b>‐</b></td><td><div class="">Google LLC < / div >< / td>< td >< b> ‐< /b >< /td >< /tr >< tr class="data-row " >< td> 5 < /td> < td>< a href= "/domain/rate-limited-proxy-66-249-91-229.google.com/dns "> rate-limited-proxy-66-249-91-229.google.com < / a> < /td>
첫 번째 정규식은 거의 작동하며 HTML 소스에서 설명 할 누락 된 공백과 끝에 이스케이프 처리되지 않은 따옴표를 제외하고 거의 작동합니다. ^로 아래 추가 사항을 표시했습니다.
m/< td>< a href= \"\/domain\/(.*)\/dns \">(.*?)/g
^ ^ ^ ^^
도움이되기를 바랍니다.
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다