데이터를 토큰 화해야하는데 정말 혼란스러워 보입니다. 다음과 같은 데이터가 있습니다.
TEXT Author Date
This is a Cat Jane 1.01.1997
This is a Dog Sara 1.02.2009
I have a cat Lesner 5.07.2001
다음과 같은 출력이 필요합니다.
Date:
1.01.1997 This
1.01.1997 is
1.01.1997 a
1.01.1997 cat
.
.
.
.
이와 같은 결과를 얻을 수있는 방법이 있습니까?
사용 Series.str.split
에 Series.explode
대한 0.25+ 팬더에서 작업 Series
:
s = df.set_index('Date')['TEXT'].str.split().explode()
print (s)
Date
1.01.1997 This
1.01.1997 is
1.01.1997 a
1.01.1997 Cat
1.02.2009 This
1.02.2009 is
1.02.2009 a
1.02.2009 Dog
5.07.2001 I
5.07.2001 have
5.07.2001 a
5.07.2001 cat
Name: TEXT, dtype: object
2 열을 DataFrame
추가하려면 Series.reset_index
다음을 추가하십시오 .
df = s.reset_index(name='text')
print (df)
Date text
0 1.01.1997 This
1 1.01.1997 is
2 1.01.1997 a
3 1.01.1997 Cat
4 1.02.2009 This
5 1.02.2009 is
6 1.02.2009 a
7 1.02.2009 Dog
8 5.07.2001 I
9 5.07.2001 have
10 5.07.2001 a
11 5.07.2001 cat
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다