awk를 사용하여 HTML 파일에서 URL을 추출하려면 어떻게해야합니까?

debugcn 에 게시 Dev

호나우두 나시 멘토

소스에 javascript 및 CSS가 포함 된 HTML 파일이 있습니다. JS에는 다른 메타 데이터와 함께 포함 된 일련의 URL이 나열되어 있습니다. awk를 사용하여 URL (모두 http : // 접두사와 함께 큰 따옴표로 묶임)을 추출하고 URL을 stdout에 덤프하고 싶습니다. 그러나 나는 awk를 사용하는 방법을 모르지만 사용하는 도구 인 것 같습니다.

{
title: "Dsssat",
artist: "cxpl djij awsoj e",
mp3: "http://somesite.com/seal/dsssat.mp3",
},

TachyonVortex

사용할 수 있습니다 grep. 큰 따옴표를 포함하려면 :

grep -o '"http://[^"]*"' myfile.html

큰 따옴표를 제외하려면 :

grep -o 'http://[^"]*' myfile.html

편집하다

JavaScript 객체의 URL 만 일치하도록 추가 필터링을 수행 할 수 있습니다.

grep -o 'mp3: "http://[^"]*"' myfile.html | grep -o '"http://[^"]*"'

grep -o 'mp3: "http://[^"]*"' myfile.html | grep -o 'http://[^"]*'

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-05-30

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

awk를 사용하여 HTML 파일에서 URL을 추출하려면 어떻게해야합니까?

awk를 사용하여 HTML 파일에서 URL을 추출하려면 어떻게해야합니까?

awk를 사용하여 CSV 파일에서 두 번째 및 세 번째 열을 추출하려면 어떻게해야합니까?

html5를 사용하여 로컬 파일을 입력하고 화면에 파일을 출력하려면 어떻게해야합니까?

nodejs를 사용하여 zip 파일을 업로드하고 추출하려면 어떻게해야합니까?

Java : Jsoup을 사용하여 HTML에서 특정 데이터를 추출하려면 어떻게해야합니까?

python3.6을 사용하여 파일에서 단어의 일부를 추출하려면 어떻게해야합니까?

HTML 파일에서 AngularJS를 사용하여 페이지에 HTML을 포함하려면 어떻게해야합니까?

pcap 파일에서 TCP SYN 플래그를 추출하고 Python (Scapy)을 사용하여 SYN Flood 공격을 감지하려면 어떻게해야합니까?

Powershell을 사용하여 .msg 파일에서 메일 헤더를 추출하려면 어떻게해야합니까?

sed를 사용하여 파일에서 html 태그를 삭제하려면 어떻게해야합니까?

awk를 사용하여 열별로 두 파일을 병합하려면 어떻게해야합니까?

이 AWK 함수를 for 루프에 넣어 열을 추출하려면 어떻게해야합니까?

Liquid / Jekyll을 사용하여 이미지 파일 이름에서 날짜를 추출하려면 어떻게해야합니까?

Python을 사용하여 로컬 xml 파일에서 특정 xml 태그를 추출하려면 어떻게해야합니까?

mpg123을 사용하여 .mov 비디오에서 .wav 파일로 오디오를 추출하려면 어떻게해야합니까?

C ++에서 Mosquitto를 사용하여 파일을 게시하려면 어떻게해야합니까?

PHPMailer를 사용하여 HTML, CSS 및 PHP를 이메일에 추가하려면 어떻게해야합니까?

Intellij IDEA에서 파일을 열고 HTML 하이라이트를 보려면 어떻게해야합니까?

fabric.js를 사용하여 URL의 이미지를 HTML 캔버스에 추가하고 크기를 조정하려면 어떻게해야합니까?

PowerShell 2 용 export-csv를 사용하여 파일을 추가하려면 어떻게해야합니까?

Pandas를 사용하여 CSV 파일에서 줄을 제거하려면 어떻게해야합니까?

ARCore Android SDK를 사용하여 SceneViewer에서 glTF 파일을로드하려면 어떻게해야합니까?

gunzip과 tar를 사용하여 내가 원하는 특정 디렉토리에 tar.gz 파일을 추출하려면 어떻게해야합니까?

.htaccess 파일 또는 이와 동등한 파일을 사용하여 다음 URL에서 "detail.html"을 제거하려면 어떻게해야합니까?

awk를 사용하여 파일에서 일치하는 패턴 (변수에 저장 됨)을 검색하려면 어떻게해야합니까?

스크립트를 사용하여 아카이브를 다운로드하고 추출하려면 어떻게해야합니까 (후속 명령에 다운로드 한 파일을 안정적으로 지정하려면 어떻게해야합니까)?

R의 정규식을 사용하여 URL에서 Google 시트 ID를 추출하려면 어떻게해야합니까?

JavaScript를 사용하여 텍스트 조각에서 배열로 URL을 추출하려면 어떻게해야합니까?

spring Mvc를 사용하여 jsps로 CSS 및 js 파일을 추가하려면 어떻게해야합니까?

.Net MVC를 사용하여 다른 파일을 재생하는 여러 html 오디오 플레이어를 나열하려면 어떻게해야합니까?