나는 해결책을 찾기 위해 많이 보았지만 하나를 찾지 못했습니다. 를 사용하여 모든 태그를 제거하는 방법을 알고 sed있지만 비어 있거나 탭이나 공백 만있는 HTML 태그 만 제거하고 태그를 명시 적으로 제거해야합니다. 예를 들면 :
sed
<p></p> or <p> </p>
다음 명령을 사용하여 모든 HTML 태그를 제거했지만 제대로 작동하지만 모든 태그를 제거하고 싶지는 않습니다.
sed -e 's/<[^>]*>//g' myfile.html
여기에서 동일한 명령이 사용 됩니다 . 친절하게 도와주세요.
아래 sed 명령을 사용하여 빈 태그 만 제거 할 수 있습니다.
sed 's/<[^\/][^<>]*> *<\/[^<>]*>//g' file
Perl을 통해
perl -pe 's/<([^<>]*)>\s*<\/\1>//g' file
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
QR 코드를 생성하려면 클릭
몇 마디 만하겠습니다