파이썬에서 악센트 부호가있는 문자를 처리하는 방법은 무엇입니까?

debugcn 에 게시 Dev

제노 달라 발레

나는 그것에 관한 많은 자료가 있다는 것을 알고 있지만 내 문제에 대한 해결책을 찾을 수 없습니다.

이 텍스트는 내가 조작해야하는 txt 파일로 작성되었으며 많은 액센트 문자가 포함되어 있습니다. 어떤 이유로 든 제대로 관리 할 수 없습니다. 내 코드는 다음과 같습니다.

file = open ('parsed.txt', 'w', encoding = 'latin1')
file.write('ààààà')

이것은 잘 작동합니다.

하지만이 작업도 잘해야합니다.

with open('input.txt', 'r', encoding = 'latin1') as f:
    string = f.read()
    or_array = string.splitlines()
    new_array = []
    for line in or_array:
        new = (line[13:]).strip()
        print(new)
        new_array.append(new)
    new_string = ''
    for lin in new_array:
        new_string += lin
        new_string += ' '
    f_n = open('parsed.txt', 'w', encoding = 'latin1')
    f_n.write(new_string)

그 코드에 무슨 문제가 있습니까?

입력:

00:00:06.49    ciaò
00:00:20.665     Questa è una provà
00:00:44.157     èè   aa ò à ùù ù
00:00:44.157

산출:

ciaò Questa è una provàèè   aa ò à ùù ù

감사합니다.

커티스 레이더

input.txt 의 내용 이 실제로 ISO-8859-1에 있으면 나를 위해 작동합니다 . UTF-8이면 잘못된 결과가 표시됩니다. 즉, 입력 내용을 복사 / 붙여 넣기하면 내용이 UTF-8 인 파일이 생성됩니다. 내가 할 경우 iconv -f utf-8 -t L1 < utf8.txt > input.txt다음 프로그램은 잘 작동합니다.

그건 그렇고, 당신의 프로그램은 관용적 인 파이썬이 아니며 큰 입력에 대해 매우 비효율적입니다.

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-2

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

파이썬에서 악센트 부호가있는 문자를 처리하는 방법은 무엇입니까?

파이썬에서 악센트 부호가있는 문자를 처리하는 방법은 무엇입니까?

파이썬에서 정규식의 악센트 문자를 설명하는 방법은 무엇입니까?

numlock / numpad없이 노트북에서 악센트 부호가있는 문자를 입력하는 쉬운 방법은 무엇입니까?

.htaccess-URL에서 대문자 및 악센트 부호가있는 문자를 악센트없는 소문자로 리디렉션하는 방법은 무엇입니까?

모든 플랫폼에서 C ++ 프로그램으로 악센트 부호가있는 문자를 표시하는 방법은 무엇입니까?

C #에서 XML에 대한 외래 / 악센트 부호가있는 문자열을 준비하는 방법은 무엇입니까?

슬러그에 악센트 부호가있는 문자가 포함되지 않도록하는 방법은 무엇입니까?

파이썬에서 악센트 부호가있는 문자

Java에서 악센트 부호가있는 문자를 변환하는 방법

ASCII에서 악센트를 나타내는 방법은 무엇입니까?

악센트에 따라 정확한 문자를 구분하는 방법은 무엇입니까?

'배치'를 사용하여 악센트가있는 파일을 이동하는 방법은 무엇입니까?

악센트 부호가있는 문자를 올바르게 인식하는 GNU Emacs 내에서 맞춤법 검사를위한 이탈리아어 사전을 얻는 방법은 무엇입니까?

악센트 부호가있는 문자도 포함하는 좋은 정규식은 무엇입니까?

Python-문자열에서 악센트 HTML 이스케이프를 감지하는 가장 좋은 방법은 무엇입니까?

macOS에서 악센트가있는 파일 이름의 이름을 바꾸는 방법은 무엇입니까?

해시 맵을 사용하여 자바의 유니 코드 문자열에서 악센트를 제거하는 방법은 무엇입니까?

악센트 부호가있는 문자에서 ASCII 문자까지의 규칙

"영어 (영국)"입력 소스를 사용하여 문자에 악센트 등을 추가하는 방법은 무엇입니까?

Jenkins Docker의 디렉터리 이름에 악센트가있는 Maven 어셈블리를 사용하는 방법은 무엇입니까?

R에서 문자열 열 (대문자 및 악센트 포함)을 정리하는 방법은 무엇입니까?

MacOS에서 악센트 부호가있는 문자를 입력하려면 어떻게합니까?

Windows에서 악센트 부호가있는 문자를 입력하려면 어떻게합니까?

ë와 같은 악센트 부호가있는 문자를 입력하려면 어떻게해야합니까?

루비에서 악센트 부호가있는 문자로 문자열을 분할하는 방법

일본어 레이아웃을 사용하여 악센트 부호를 입력하는 방법은 무엇입니까?

ggplot 범례에 악센트 부호가있는 임의의 문자 삽입

프랑스어 악센트 부호가있는 단어를 Magento 1.8 용 코드로 변환하는 방법은 무엇입니까?

KDE 입력은 악센트 부호가있는 문자를 허용하지 않습니다.

Qt5의 QRegularExpressions에서 악센트 부호가있는 문자 처리