데이터베이스 검색 엔진 인 웹 페이지의 소스 파일을 다운로드하고 싶습니다. curl을 사용하면 기본 html 페이지 만 다운로드 할 수 있습니다. 또한 웹 페이지에 링크되어 있고 메인 html 페이지에 언급 된 모든 javascript 파일, css 파일 및 php 파일을 다운로드하고 싶습니다. curl / wget 또는 다른 유틸리티를 사용하여 수행 할 수 있습니까?
우선, 웹 사이트 운영자에게 이것이 허용 가능한 서비스 사용인지 확인해야합니다. 그 후에 다음과 같이 할 수 있습니다.
wget -pk example.com
-p
페이지를보기위한 필수 조건 (Javascript, CSS 등)을 가져옵니다. -k
페이지의 링크를 로컬보기에 사용할 수있는 링크로 변환합니다.
에서 man wget
:
-p,-페이지 필수 조건
이 옵션은 Wget이 주어진 HTML 페이지를 올바르게 표시하는 데 필요한 모든 파일을 다운로드하도록합니다. 여기에는 인라인 이미지, 사운드 및 참조 된 스타일 시트가 포함됩니다.
[...]
-k,-변환 링크
다운로드가 완료된 후 문서의 링크를 로컬보기에 적합하도록 변환하십시오. 이는 보이는 하이퍼 링크뿐만 아니라 포함 된 이미지, 스타일 시트에 대한 링크, HTML이 아닌 콘텐츠에 대한 하이퍼 링크 등과 같이 외부 콘텐츠에 연결되는 문서의 모든 부분에 영향을줍니다.
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다