파이썬에서 두 개의 마지막 문자를 기반으로 별도의 단어

debugcn 에 게시 Dev

나탈리아 레 센데

a, as, e, es, o, os로 끝나는 포르투갈어 단어를 구분하는 프로그램이 있습니다. 몇 가지 목록을 만들고 파일을 반복하고 파일의 단어를 엔딩에 따라 다른 목록에 할당합니다. 패턴과 일치하지 않는 단어는 "기타"라는 목록에 할당됩니다. 이제 마지막 두 글자를 기준으로 나머지 모든 단어를 분리하고 싶습니다. 예를 들어 'em'으로 끝나는 단어는 'em'이라는 목록에 할당되고 'ul'으로 끝나는 단어는 'ul'이라는 목록에 할당됩니다. 그러나 확인한 결과 470 개의 다른 엔딩이 있기 때문에 엄청난 코드로 끝날 것입니다! 따라서 470 개의 목록을 수동으로 만들어야합니다. 누구든지 내가 어떻게 자동으로 할 수 있는지 알고 있습니까? 아니면 문제에 대한 다른 해결책이 있습니까? 지금까지 내 코드는 다음과 같습니다. 미리 감사드립니다 !!

from nltk.tokenize import sent_tokenize,wordpunct_tokenize
import re
import os
import io
import sys
from pathlib import Path

while True:
    try:
        file_to_open =Path(input("Please, insert your file path: "))
        with open(file_to_open,'r', encoding="utf-8") as f:
            words = f.read().lower()
            break         
    except FileNotFoundError:
        print("\nFile not found. Better try again")
    except IsADirectoryError:
        print("\nIncorrect Directory path.Try again")

other=[]

e=[]
o=[]
a=[]

for y in words:
    if y[-1:] == 'a'or y[-2:]=='as':
        a.append(y)
    elif y[-1:] == 'o' or y[-2:] =='os' :
        o.append(y)
    elif y[-1:] == 'e'or y[-2:]=='es':
        e.append(y)
    else:
        other.append(y)

otherendings=[]

for t in other:
    endings=t[-2:]
    otherendings.append(endings)

print(len(otherendings))
print(set(otherendings)) #470

아베

키가 단어로 끝나는 사전 만들기 :

word_dict = {}
for word in words:
    ending = word[-2:]
    try: 
        word_dict[ending].append(word)
    except:
        word_dict[ending] = [word]

단어를 반복하면 키가 두 글자로 구성된 문자열이되는 사전이 생기고 각 키에는이 두 글자로 끝나는 단어 목록이 포함됩니다.

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-5

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

파이썬에서 두 개의 마지막 문자를 기반으로 별도의 단어

파이썬에서 두 개의 마지막 문자를 기반으로 별도의 단어

파이썬의 문자열에서 마지막 단어 얻기

파이썬에서 마지막 두 번째 단어를 자르기

두 단어 사이의 마지막 단어를 RegEx로 바꿉니다.

[HTML / JS] 문자열의 두 번째 마지막 단어 앞에 "&"를 추가하고 해당 문자열에 단일 단어가있는 경우 "&"숨기기

마지막 두 글자를 기준으로 파이썬 정렬 단어

R의 문자열에서 마지막 두 단어 사이의 간격 제거

Oracle plsql의 문자열에서 두 개 이상의 문자가있는 두 번째 마지막 단어를 얻는 방법

파이썬 단어의 첫 글자와 마지막 세 글자를 대문자로 쓰는 방법

파이썬에서 두 문자열에서 단어의 교차점 찾기

문자열의 마지막 단어 앞에 쉼표를 &로 바꾸기

파이썬에서 모음이 있는지 확인하기 위해 문장에서 각 단어의 처음 두 글자를 어떻게 확인합니까?

구분 기호의 마지막 두 번 발생을 기반으로 문자열을 두 개로 분할

문자열에서 4 개의 문자 단어를 모두 찾는 알고리즘-마지막 항목은 어디입니까?

문장의 마지막 단어를 대문자로 표시

PHP에서 문장의 각 단어의 마지막 글자를 어떻게 대문자로 표시합니까?

ID를 기반으로 두 개의 개별 XLS 문서 병합

r의 마지막 단어를 기준으로 문자열 정렬

문자열에서 마지막으로 나타나는 대문자 단어와 다른 단어 사이의 모든 문자를 일치시키는 RegEx

마지막으로 파이썬에서 try 절의 break, continue, return 문 전에 실행을 차단하십시오.

Excel : 마지막 (또는 두 번째에서 마지막으로) 발생의 왼쪽과 오른쪽으로 문자를 반환합니까?

테이블의 문자열에서 마지막 단어 가져 오기

별표 (*)로 마지막 단어를 교체하거나 두 단어를 마지막으로

URL의 두 번째에서 마지막 "/"문자를 '#'로 바꿉니다.

파이썬에서 x 축의 두 특정 지점 사이에 단일 가로 막대를 어떻게 생성합니까?

이 코드 Java를 기반으로 파일의 각 문장에 몇 개의 단어가 있는지

Pandas 데이터 프레임에서 원하는 접두사를 가진 문장의 마지막 단어 추출

파이썬에서 주어진 조건을 기반으로 목록의 두 요소를 결합하는 방법

문자열의 처음과 마지막 사이에 단어 가져 오기

마지막 두 단어를 다른 범위에두기