다른 열을 기반으로 데이터 프레임의 텍스트 및 개수 토큰 화

s_khan92

데이터를 토큰 화해야하는데 정말 혼란스러워 보입니다. 다음과 같은 데이터가 있습니다.

TEXT               Author               Date
This is a Cat       Jane                 1.01.1997
This is a Dog       Sara                 1.02.2009
I have a cat        Lesner               5.07.2001

다음과 같은 출력이 필요합니다.

Date:
1.01.1997    This
1.01.1997    is
1.01.1997     a
1.01.1997    cat
.
.
.
.

이와 같은 결과를 얻을 수있는 방법이 있습니까?

이스 르엘

사용 Series.str.splitSeries.explode대한 0.25+ 팬더에서 작업 Series:

s = df.set_index('Date')['TEXT'].str.split().explode()
print (s)
Date
1.01.1997    This
1.01.1997      is
1.01.1997       a
1.01.1997     Cat
1.02.2009    This
1.02.2009      is
1.02.2009       a
1.02.2009     Dog
5.07.2001       I
5.07.2001    have
5.07.2001       a
5.07.2001     cat
Name: TEXT, dtype: object

2 열을 DataFrame추가하려면 Series.reset_index다음을 추가하십시오 .

df = s.reset_index(name='text')
print (df)
         Date  text
0   1.01.1997  This
1   1.01.1997    is
2   1.01.1997     a
3   1.01.1997   Cat
4   1.02.2009  This
5   1.02.2009    is
6   1.02.2009     a
7   1.02.2009   Dog
8   5.07.2001     I
9   5.07.2001  have
10  5.07.2001     a
11  5.07.2001   cat

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

pyspark 데이터 프레임 열 토큰 화 및 새 열에서 스트로 잉

분류에서Dev

데이터 프레임의 다른 열을 기반으로 열을 수정하는 최적화 된 방법

분류에서Dev

다른 데이터 프레임의 인덱스 및 열을 기반으로 데이터 프레임 셀을 NaN으로 교체

분류에서Dev

R bu에서 몇 개의 열을 추출하여 데이터 프레임을 부분 설정하는 방법 및 simmilar 열을 기반으로 한 데이터 프레임에서 다른 데이터 프레임으로 열을 추가하는 방법

분류에서Dev

다른 열을 기반으로 데이터 프레임 그룹화 / 요약 및 합산

분류에서Dev

다른 열을 기반으로 데이터 프레임 열의 값 수정

분류에서Dev

R의 다른 데이터 프레임을 기반으로 열에 텍스트를 할당하는 방법

분류에서Dev

한 데이터 프레임의 다중 인덱스와 다른 데이터 프레임의 열을 기반으로 두 데이터 프레임에서 두 개의 데이터 프레임 생성

분류에서Dev

다른 데이터 프레임에있는 행의 조건을 기반으로 한 데이터 프레임의 행 인덱스를 찾는 벡터화 방법

분류에서Dev

Pandas 데이터 프레임의 새 열로 단어 토큰 화

분류에서Dev

R 다른 열의 텍스트를 기반으로 데이터 프레임 열 수를 반복하고 늘립니다.

분류에서Dev

ID 및 다른 데이터 프레임의 값을 기반으로 한 데이터 프레임의 값 설정

분류에서Dev

NLTK를 사용하여 데이터 프레임의 텍스트 열을 토큰 화하는 방법

분류에서Dev

다른 데이터 프레임의 값을 기반으로 데이터 프레임 항목 그룹화

분류에서Dev

다른 데이터 프레임을 기반으로 다른 열의 NA 값 병합 및 채우기

분류에서Dev

두 개의 다른 데이터 프레임을 기반으로 패널 데이터 프레임 만들기

분류에서Dev

다른 (동일한 행 수) 데이터 프레임의 열을 기준으로 그룹화

분류에서Dev

Python의 다른 데이터 프레임을 기반으로 데이터 프레임 업데이트

분류에서Dev

다른 데이터 세트의 열 값을 기반으로 한 데이터 프레임에 열 만들기

분류에서Dev

다른 데이터 프레임의 값을 기반으로 한 데이터 프레임의 관찰 수 계산

분류에서Dev

다른 열의 값을 기반으로 pandas 데이터 프레임의 열 정규화

분류에서Dev

다른 데이터 프레임의 수를 기반으로 데이터 프레임에 열 추가

분류에서Dev

2 개의 서로 다른 열을 기반으로 동적으로 데이터 프레임 채우기

분류에서Dev

데이터 프레임 열의 이전 및 다음 요소를 기반으로 Python 함수 만들기

분류에서Dev

동일한 데이터 프레임의 다른 열에있는 문자를 기반으로 데이터 프레임에 텍스트 열 추가

분류에서Dev

Pandas 데이터 프레임의 다른 열 값을 기반으로 'Balance'열을 업데이트하는 방법

분류에서Dev

다른 데이터 프레임의 열 이름, ID 번호 및 키 값을 기반으로 데이터 프레임의 값 바꾸기

분류에서Dev

Pandas의 공통 열을 기반으로 다른 데이터 프레임에서 여러 열 업데이트

분류에서Dev

다른 열을 기반으로하는 Spark 데이터 프레임의 열 값 업데이트

Related 관련 기사

  1. 1

    pyspark 데이터 프레임 열 토큰 화 및 새 열에서 스트로 잉

  2. 2

    데이터 프레임의 다른 열을 기반으로 열을 수정하는 최적화 된 방법

  3. 3

    다른 데이터 프레임의 인덱스 및 열을 기반으로 데이터 프레임 셀을 NaN으로 교체

  4. 4

    R bu에서 몇 개의 열을 추출하여 데이터 프레임을 부분 설정하는 방법 및 simmilar 열을 기반으로 한 데이터 프레임에서 다른 데이터 프레임으로 열을 추가하는 방법

  5. 5

    다른 열을 기반으로 데이터 프레임 그룹화 / 요약 및 합산

  6. 6

    다른 열을 기반으로 데이터 프레임 열의 값 수정

  7. 7

    R의 다른 데이터 프레임을 기반으로 열에 텍스트를 할당하는 방법

  8. 8

    한 데이터 프레임의 다중 인덱스와 다른 데이터 프레임의 열을 기반으로 두 데이터 프레임에서 두 개의 데이터 프레임 생성

  9. 9

    다른 데이터 프레임에있는 행의 조건을 기반으로 한 데이터 프레임의 행 인덱스를 찾는 벡터화 방법

  10. 10

    Pandas 데이터 프레임의 새 열로 단어 토큰 화

  11. 11

    R 다른 열의 텍스트를 기반으로 데이터 프레임 열 수를 반복하고 늘립니다.

  12. 12

    ID 및 다른 데이터 프레임의 값을 기반으로 한 데이터 프레임의 값 설정

  13. 13

    NLTK를 사용하여 데이터 프레임의 텍스트 열을 토큰 화하는 방법

  14. 14

    다른 데이터 프레임의 값을 기반으로 데이터 프레임 항목 그룹화

  15. 15

    다른 데이터 프레임을 기반으로 다른 열의 NA 값 병합 및 채우기

  16. 16

    두 개의 다른 데이터 프레임을 기반으로 패널 데이터 프레임 만들기

  17. 17

    다른 (동일한 행 수) 데이터 프레임의 열을 기준으로 그룹화

  18. 18

    Python의 다른 데이터 프레임을 기반으로 데이터 프레임 업데이트

  19. 19

    다른 데이터 세트의 열 값을 기반으로 한 데이터 프레임에 열 만들기

  20. 20

    다른 데이터 프레임의 값을 기반으로 한 데이터 프레임의 관찰 수 계산

  21. 21

    다른 열의 값을 기반으로 pandas 데이터 프레임의 열 정규화

  22. 22

    다른 데이터 프레임의 수를 기반으로 데이터 프레임에 열 추가

  23. 23

    2 개의 서로 다른 열을 기반으로 동적으로 데이터 프레임 채우기

  24. 24

    데이터 프레임 열의 이전 및 다음 요소를 기반으로 Python 함수 만들기

  25. 25

    동일한 데이터 프레임의 다른 열에있는 문자를 기반으로 데이터 프레임에 텍스트 열 추가

  26. 26

    Pandas 데이터 프레임의 다른 열 값을 기반으로 'Balance'열을 업데이트하는 방법

  27. 27

    다른 데이터 프레임의 열 이름, ID 번호 및 키 값을 기반으로 데이터 프레임의 값 바꾸기

  28. 28

    Pandas의 공통 열을 기반으로 다른 데이터 프레임에서 여러 열 업데이트

  29. 29

    다른 열을 기반으로하는 Spark 데이터 프레임의 열 값 업데이트

뜨겁다태그

보관