DOCX 문서의 경우 다음을 수행합니다.
document = zipfile.ZipFile(path)
soup = BeautifulSoup(document.read('word/document.xml'), 'html.parser')
DOC 문서에 대해 어떻게해야합니까?
DOCX는 처리하기에 충분히 견고하며 XML 기반이며 국제 표준 기관에서 문서화합니다. DOC 파일은 바이너리이며 독점적입니다.
DOC 파일을 직접 처리하려고하지 마십시오. 먼저 DOCX로 변환하십시오.
보다:
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다