쉼표로 구분 된 형식의 2 개 값을 포함하는 마지막 열을 2 개의 개별 열로 변환하려고합니다. 동기를 이해하려면 입력 및 출력 파일의 마지막 열을 참조하십시오.
다음은 내 입력 파일의 모습입니다.
fILENAME sent_no word POS lab,Slab
File_1 sentence:1 abc NNP B,NO
fhj PSP O,O
bmm NNP B,NO
vbn PSP O,O
vbn NN B,NO
vbn NNPC B,NO
. Sym O,O
File_1 Sentence:2 vbb NNP B,NO
bbn PSP B,NO
nnm NNP O,O
nnn PSP B,NO
bbn NN O,O
. Sym O,O
및 출력 출력 파일 I 예상은 다음과 같다 :
Filename sent_num word POS Label Slab
File_1 sentence:1 abc NNP B NO
fhj PSP O O
bmm NNP B NO
vbn PSP O O
vbn NN B NO
vbn NNPC B NO
. Sym O O
File_1 Sentence:2 vbb NNP B NO
bbn PSP B NO
nnm NNP O O
nnn PSP B NO
bbn NN O O
. Sym O O
이 시도 :
import pandas
df = pandas.read_csv('try.csv',sep=';')
df[['Label','Slabel']]=df['Label,Slabel'].str.split(',',expand=True)
df.drop(['Label,Slabel'],axis=1,inplace=True)
df.to_csv('try2.csv',sep=';')
하지만 다중 인덱스 데이터 프레임을 사용하여 데이터를 볼 수 있으므로 다음을 추가합니다.
df.set_index(['Filename','Sentence_num'],inplace=True)
결과 :
>>> df
Word POS Label Slabel
Filename Sentence_num
File_1 sentence:1 abc NNP B NO
sentence:1 fhj PSP O O
sentence:1 bmm NNP B NO
sentence:1 vbn PSS O O
File_2 sentence:2 vbb NNP B NO
sentence:2 bbn PSP B NO
sentence:2 nnm NNP O O
sentence:2 nnnm PSP B NO
>>>
간단한 방법으로 다음과 같이 다중 구분 기호를 사용할 수 있습니다.
import pandas as pd
df = pandas.read_csv('try.csv',sep=' |,', engine='python') # separator space and comma
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다