특이한 형식의 .txt 파일을 XML로 변환

debugcn 에 게시 Dev

Legatrix

박사 과정에서 개인적으로 사용하기위한 '용어집'인 대용량 일반 텍스트 파일이 여러 개 있습니다. 다음과 같이 쓸모없는 형식입니다.

%%% <entry i>

    Blah Blah Blah, see also > <entry j>


%%% <entry i+1>

등 (상호 참조에 유의하십시오.)

현재 상태에서는 이러한 파일을 쉽게 사용할 수 없습니다 (예 : LaTeX로 디스플레이 버전을 만들거나 웹 사이트에 항목의 하위 집합을 넣는 데 사용). 기본적 으로 텍스트 편집기 에서만 찾아 볼 수 있습니다 . 모든 것을 XML로 변환하는 것이 유연성과 유용성을 높이는 가장 좋은 방법 인 것 같습니다. 그렇다면이를 수행하는 가장 좋은 방법은 무엇일까요?

산도르 곰 바이

이것은 파이썬에서 그러한 변환기의 기초가 될 수 있습니다.

#!/usr/bin/python

import fileinput
import re

entryre = re.compile( "^%%% <([^>]+)>")
seealsore = re.compile( "see also > <([^>]+)>")

def pnode(nodename, nodeblock):
    print "<" + nodename + ">"
    print nodeblock
    print "</" + nodename + ">"


block = ""
entry = ""
for line in fileinput.input():
    match = re.match( entryre, line)
    if match:
        if entry:
            pnode(entry, block)
            block = ""
            entry = ""
        entry = match.group(1)
    else:
        match = re.match( seealsore, line)
        line = re.sub( seealsore, r'<seealso>\1</seealso>', line)
        block += line

pnode(entry, block)

모든 파일 (stdin 권장)을 읽고 stdout을 씁니다. xml head와 tail 사이에 출력을 감 쌉니다. 항목에 공백이 포함 된 경우주의해야합니다. 또한 블록에 태그와 유사한 ( "") 하위 문자열이 포함되어 있으면 추가 변환이 필요합니다.

그러나 항목을 찾아보고 싶다면 간단한 html을 사용하는 것이 좋습니다. 정의 목록이나 표는 모두 당신을 잘 제공 할 것입니다. 변환 코드는 약간만 변경하면됩니다.

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-06-2

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

특이한 형식의 .txt 파일을 XML로 변환

특이한 형식의 .txt 파일을 XML로 변환

txt 파일을 파이썬의 사전으로 변환

모든 형식 (.txt, .Doc) 파일을 Android 애플리케이션에서 epub 파일로 변환하는 방법

CSV 파일을 적절한 XML 형식으로 변환

사전 형식의 txt 파일을 파이썬의 데이터 프레임으로 변환하는 방법은 무엇입니까?

txt 파일의 문자열을 파이썬의 배열로 변환

CSV 파일을 쉼표로 pyhton의 txt 파일로 변환

사전 파일을 별도의 txt 파일로 변환

wav 파일을 txt 파일로 변환

csv 파일을 txt 파일로 변환

txt 파일을 xls 파일로 변환

txt 파일을 변환 된 형식에서 pandas DataFrame으로 읽는 방법

파이썬은 로그 파일을 html 형식으로 변환

한 형식의 파일 이름을 다른 형식으로 변경

Excel : 특이한 분 형식을 숫자로 변환

KDB 테이블을 특수 형식의 사전으로 변환

디렉터리에있는 여러 파일을 .txt 형식으로 변환합니다. 그러나 파일 이름은 바이너리가됩니다.

XML 파일을 플랫 파일 형식으로 변환

Angular의 파일 형식으로 이미지 변환

강력한 형식의 식을 익명 형식 반환으로 변환

큰 .txt 파일을 ophcrack 무지개 테이블로 변환

.csv 파일의 Excel 날짜 형식 열을 시계열 변환을위한 날짜로 인식

TXT 파일에서 데이터로드 및 TraMineR에서 TSE 형식으로 변환

아래 txt 테이블을 csv 테이블 형식으로 변환

항목의 txt 파일 목록을 PHP에서 배열을 만들기위한 실제 코드로 변환

.pgn 파일 형식의 체스 이동 파일을 .bin 파일 형식으로 일괄 변환하려면 어떻게해야합니까?

2 열 데이터 파일을 행 형식으로 변환

.txt 파일의 날짜 형식 변경

Python에서 실제로 HTML / XML 형식 인 아래의 이상한 .XLS 파일을 .XLSX로 변환 할 수 있습니까?

txt 파일을 xml로 어떻게 변환합니까?