문자열의 구분 된 데이터를 단일 열의 값으로 변환

debugcn 에 게시 Dev

무니

다음과 같은 데이터 프레임이 있습니다.

Var_1
201601_abc
201603_tbc;201608_sdf;201508_dsf
201601_abc;201508_dsf
...

Var1에 고유 한 값을 포함하는 단일 열을 원합니다 ( ";"로 구분 된 값은 다른 것으로 간주 됨

따라서 최종 데이터 프레임은 다음과 같습니다.

Var_2
201601_abc
201603_tbc
201608_sdf
201508_dsf

EdChum

IIUC 다음이 작동합니다.

In [160]:
df2 = pd.DataFrame(df['Var_1'].str.split(';',expand=True).stack().unique(), columns=['Var_2'])
df2

Out[160]:
        Var_2
0  201601_abc
1  201603_tbc
2  201608_sdf
3  201508_dsf

이것은 구분 기호의 값을 분할 한 다음 stacks를 반환하고 unique값을 반환합니다. 그런 다음 반환 된 배열을 기반으로 새 df를 생성 할 수 있습니다.

위의 단계를 분할 :

In [161]:
df['Var_1'].str.split(';',expand=True)

Out[161]:
            0           1           2
0  201601_abc        None        None
1  201603_tbc  201608_sdf  201508_dsf
2  201601_abc  201508_dsf        None

In [162]:    
df['Var_1'].str.split(';',expand=True).stack()

Out[162]:
0  0    201601_abc
1  0    201603_tbc
   1    201608_sdf
   2    201508_dsf
2  0    201601_abc
   1    201508_dsf
dtype: object

In [163]:
df['Var_1'].str.split(';',expand=True).stack().unique()

Out[163]:
array(['201601_abc', '201603_tbc', '201608_sdf', '201508_dsf'], dtype=object)

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-06-12

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

문자열의 구분 된 데이터를 단일 열의 값으로 변환

문자열의 구분 된 데이터를 단일 열의 값으로 변환

하나의 열 스파크 데이터 프레임을 Python에서 pipline 문자로 구분 된 단일 문자열로 변환

R : 임의의 연결된 변수 이름과 값으로 구성된 벡터를 단일 데이터 프레임으로 변환

PHP의 트리에서 쉼표로 구분 된 값으로 문자열 변환

구분 된 문자열을 Oracle의 행으로 변환

정의 된 구분 기호를 사용하여 문자열 배열을 문자열로 변환

데이터 프레임 열의 숫자를 쉼표로 구분 된 숫자로 변환하는 방법

줄 바꿈으로 구분 된 파이썬의 문자열 파일을 json 배열로 구문 분석

큰 문자열의 쉼표로 구분 된 부분 문자열을 QML의 변형 배열 요소로 변환

구분 된 문자열을 C #의 dictionary <string, uint>로 변환

어떻게 쉼표로 구분 된 값으로 문자열의 목록을 변환, 자동으로 따옴표를 추가

Word 2016 단일 열 표를 쉼표로 구분 된 표로 변환

문자열의 일부를 데이터 프레임의 다른 열로 변환

공백으로 구분 된 문자열을 PHP의 클래스로 변환

탭으로 구분 된 파일에서 문자열 요소의 단어 수

숫자 그룹이있는 문자열을 PL / SQL에서 단일 숫자가있는 쉼표로 구분 된 문자열로 변환

arrayList를 하이픈으로 구분 된 문자열로 변환하는 방법

REAL의 배열 행을 쉼표로 구분 된 문자열로 변환

SQL Server의 IN 절에 대해 단일 쉼표로 구분 된 문자열을 여러 문자열로 구분

문자열의 단어 당 문자 수를 계산하여 쉼표로 구분 된 값을 반환하는 방법이 있습니까?

int []를 쉼표로 구분 된 문자열로 변환

기호로 구분 된 두 개의 임의 길이 문자열 전환

쉼표로 구분 된 열에서 여러 행을 단일 행으로 변환

vector <int>를 구분 된 문자열로 변환

최대 N 단어로 구분 된 부분 문자열의 정규식 일치

배열의 구분 된 문자열 값을 부울 변수로 분리

PHP 루프를 사용하지 않고 쉼표로 구분 된 값의 문자열을 다른 형식으로 변환

공백으로 구분 된 문자열의 일부 추출

R 공백으로 구분 된 문자열 데이터를 열로 분할

헤더와 열 데이터를 "|"로 구분 된 변환 pyspark의 특정 헤더 이름과 데이터 행이있는 별도의 열로