소스에 javascript 및 CSS가 포함 된 HTML 파일이 있습니다. JS에는 다른 메타 데이터와 함께 포함 된 일련의 URL이 나열되어 있습니다. awk를 사용하여 URL (모두 http : // 접두사와 함께 큰 따옴표로 묶임)을 추출하고 URL을 stdout에 덤프하고 싶습니다. 그러나 나는 awk를 사용하는 방법을 모르지만 사용하는 도구 인 것 같습니다.
{
title: "Dsssat",
artist: "cxpl djij awsoj e",
mp3: "http://somesite.com/seal/dsssat.mp3",
},
사용할 수 있습니다 grep
. 큰 따옴표를 포함하려면 :
grep -o '"http://[^"]*"' myfile.html
큰 따옴표를 제외하려면 :
grep -o 'http://[^"]*' myfile.html
편집하다
JavaScript 객체의 URL 만 일치하도록 추가 필터링을 수행 할 수 있습니다.
grep -o 'mp3: "http://[^"]*"' myfile.html | grep -o '"http://[^"]*"'
grep -o 'mp3: "http://[^"]*"' myfile.html | grep -o 'http://[^"]*'
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다