Python을 사용하여 txt 파일 또는 PDF를 Word 문서로 변환하는 방법은 무엇입니까?

tmthyjames

PDF (또는 텍스트 파일)를 Python에서 Word 문서로 변환하는 방법이 있습니까? 교수님을 위해 웹 스크래핑을하고 있는데 원본 문서는 PDF입니다. 그 중 1,611 개를 모두 텍스트 파일로 변환했고 이제 Word 문서로 변환해야합니다. 내가 찾을 수있는 유일한 것은 Word-to-txt 변환기였으며 그 반대가 아닙니다.

감사!

tmthyjames

python-docx를 사용하여 txt 파일을 Word 문서로 쉽게 변환 할 수있었습니다.

내가 한 일입니다.

from docx import Document
import re
import os

path = '/users/tdobbins/downloads/smithtxt'
direct = os.listdir(path)

for i in direct:
    document = Document()
    document.add_heading(i, 0)
    myfile = open('/path/to/read/from/'+i).read()
    myfile = re.sub(r'[^\x00-\x7F]+|\x0c',' ', myfile) # remove all non-XML-compatible characters
    p = document.add_paragraph(myfile)
    document.save('/path/to/write/to/'+i+'.docx')

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

Python을 사용하여 txt 파일 또는 PDF를 Word 문서로 변환하는 방법은 무엇입니까?

분류에서Dev

autocmd를 사용하여 PDF 파일을 TXT 파일로 변환하는 방법은 무엇입니까?

분류에서Dev

C #을 사용하여 Word 문서 (XML 기반)를 PDF로 변환하는 방법은 무엇입니까?

분류에서Dev

Python을 사용하여 txt 파일을 json 형식으로 변환하는 방법은 무엇입니까?

분류에서Dev

NTwain을 사용하여 스캔 한 ImageSource를 pdf 파일로 변환하는 방법은 무엇입니까?

분류에서Dev

선행 공백을 사용하여 txt 파일을 json으로 변환하는 방법은 무엇입니까?

분류에서Dev

docx 또는 doc 파일을 Java에서 txt로 변환하는 가장 좋은 방법은 무엇입니까?

분류에서Dev

robots.txt 파일을 사용하여 방문 페이지를 차단하는 방법은 무엇입니까?

분류에서Dev

plink를 사용하여 vcf 파일을 ped 파일로 변환하는 방법은 무엇입니까?

분류에서Dev

soffice 명령을 사용하여 pdf 파일을 jpg로 변환하는 방법은 무엇입니까?

분류에서Dev

boud를 다른 문자열로 바꿀 때 txt 파일에서 문자열을 정수로 변환하는 방법은 무엇입니까? 파이썬

분류에서Dev

Python 3.5를 사용하여 mysql 데이터를 .txt 파일로 가져 오는 방법은 무엇입니까?

분류에서Dev

Vim에서 help cmd를 사용하여 .txt 파일을 보는 방법은 무엇입니까?

분류에서Dev

Vim에서 help cmd를 사용하여 .txt 파일을 보는 방법은 무엇입니까?

분류에서Dev

Java에서 itext를 사용하여 pdf로 변환하려는 doc 파일이 있습니다.이 작업을 수행하는 방법은 무엇입니까?

분류에서Dev

Python을 사용하여 .csv 파일의 행에서 별도의 .txt 파일로 데이터를 추출하는 방법은 무엇입니까?

분류에서Dev

DFSORT를 사용하여 IBM 파일을 16 진수로 변환하는 방법은 무엇입니까?

분류에서Dev

VLC 또는 Audacity를 사용하여 한 번에 여러 파일 (예 : wav를 mp3로)을 변환하는 방법은 무엇입니까?

분류에서Dev

Python을 사용하여 Ubuntu에서 HTML 페이지를 PDF로 변환하는 방법은 무엇입니까?

분류에서Dev

tar를 사용하여 .txt 파일의 파일 그룹을 압축하는 방법은 무엇입니까?

분류에서Dev

.djvu 파일을 .pdf로 대량 변환하는 방법은 무엇입니까?

분류에서Dev

.djvu 파일을 .pdf로 대량 변환하는 방법은 무엇입니까?

분류에서Dev

grep 또는 awk를 사용하여 로그 파일을 조작하는 방법은 무엇입니까?

분류에서Dev

gmmagick을 사용하여 여러 tiff 파일을 png 파일로 변환하는 방법은 무엇입니까?

분류에서Dev

깊이 값이 포함 된 ".txt"파일을 읽은 다음 MATLAB을 사용하여 이미지로 변환하는 방법은 무엇입니까?

분류에서Dev

폴더의 모든 odt 파일을 Microsoft Word 파일로 변환하는 방법은 무엇입니까?

분류에서Dev

Adobe Acrobat Pro를 사용하여 배치, 즉 거대한 PDF 파일을 텍스트로 변환하는 방법은 무엇입니까?

분류에서Dev

AWK를 사용하여 .txt 파일을 .csv로 변환하는 방법

분류에서Dev

.odt 문서를 .org 파일로 변환하는 방법은 무엇입니까?

Related 관련 기사

  1. 1

    Python을 사용하여 txt 파일 또는 PDF를 Word 문서로 변환하는 방법은 무엇입니까?

  2. 2

    autocmd를 사용하여 PDF 파일을 TXT 파일로 변환하는 방법은 무엇입니까?

  3. 3

    C #을 사용하여 Word 문서 (XML 기반)를 PDF로 변환하는 방법은 무엇입니까?

  4. 4

    Python을 사용하여 txt 파일을 json 형식으로 변환하는 방법은 무엇입니까?

  5. 5

    NTwain을 사용하여 스캔 한 ImageSource를 pdf 파일로 변환하는 방법은 무엇입니까?

  6. 6

    선행 공백을 사용하여 txt 파일을 json으로 변환하는 방법은 무엇입니까?

  7. 7

    docx 또는 doc 파일을 Java에서 txt로 변환하는 가장 좋은 방법은 무엇입니까?

  8. 8

    robots.txt 파일을 사용하여 방문 페이지를 차단하는 방법은 무엇입니까?

  9. 9

    plink를 사용하여 vcf 파일을 ped 파일로 변환하는 방법은 무엇입니까?

  10. 10

    soffice 명령을 사용하여 pdf 파일을 jpg로 변환하는 방법은 무엇입니까?

  11. 11

    boud를 다른 문자열로 바꿀 때 txt 파일에서 문자열을 정수로 변환하는 방법은 무엇입니까? 파이썬

  12. 12

    Python 3.5를 사용하여 mysql 데이터를 .txt 파일로 가져 오는 방법은 무엇입니까?

  13. 13

    Vim에서 help cmd를 사용하여 .txt 파일을 보는 방법은 무엇입니까?

  14. 14

    Vim에서 help cmd를 사용하여 .txt 파일을 보는 방법은 무엇입니까?

  15. 15

    Java에서 itext를 사용하여 pdf로 변환하려는 doc 파일이 있습니다.이 작업을 수행하는 방법은 무엇입니까?

  16. 16

    Python을 사용하여 .csv 파일의 행에서 별도의 .txt 파일로 데이터를 추출하는 방법은 무엇입니까?

  17. 17

    DFSORT를 사용하여 IBM 파일을 16 진수로 변환하는 방법은 무엇입니까?

  18. 18

    VLC 또는 Audacity를 사용하여 한 번에 여러 파일 (예 : wav를 mp3로)을 변환하는 방법은 무엇입니까?

  19. 19

    Python을 사용하여 Ubuntu에서 HTML 페이지를 PDF로 변환하는 방법은 무엇입니까?

  20. 20

    tar를 사용하여 .txt 파일의 파일 그룹을 압축하는 방법은 무엇입니까?

  21. 21

    .djvu 파일을 .pdf로 대량 변환하는 방법은 무엇입니까?

  22. 22

    .djvu 파일을 .pdf로 대량 변환하는 방법은 무엇입니까?

  23. 23

    grep 또는 awk를 사용하여 로그 파일을 조작하는 방법은 무엇입니까?

  24. 24

    gmmagick을 사용하여 여러 tiff 파일을 png 파일로 변환하는 방법은 무엇입니까?

  25. 25

    깊이 값이 포함 된 ".txt"파일을 읽은 다음 MATLAB을 사용하여 이미지로 변환하는 방법은 무엇입니까?

  26. 26

    폴더의 모든 odt 파일을 Microsoft Word 파일로 변환하는 방법은 무엇입니까?

  27. 27

    Adobe Acrobat Pro를 사용하여 배치, 즉 거대한 PDF 파일을 텍스트로 변환하는 방법은 무엇입니까?

  28. 28

    AWK를 사용하여 .txt 파일을 .csv로 변환하는 방법

  29. 29

    .odt 문서를 .org 파일로 변환하는 방법은 무엇입니까?

뜨겁다태그

보관