데이터 프레임에서 중복 된 목록 찾기

debugcn 에 게시 Dev

하퍼

다음과 같은 데이터 프레임이 있습니다.

ID, Name, SchoolID, Grade, Major  
1, Alice, School_1, 10, Physics  
2, Bob, School_1, 8, Biology  
3, Alice, School_2, 10, Physics  
4, Alice, School_1, 10, Physics

각 학교에서 중복 된 목록을 찾으려면 어떻게해야합니까? (같은 학교에 이름, 학년, 전공이 같은 목록은 중복 된 것으로 간주됩니다.)

예상 결과:

ID, Name, SchoolID, Grade, Major, Is_duplicated    
1, Alice, School_1, 10, Physics, Yes  
2, Bob, School_1, 8, Biology, No  
3, Alice, School_2, 10, Physics, No    
4, Alice, School_1, 10, Physics, Yes

감사합니다.

이스 르엘

및 매개 변수 DataFrame.duplicated와 함께 사용 :keep=Falsesubset

df['Is_duplicated'] = df.duplicated(keep=False, subset=['Name','Grade','Major','SchoolID'])
print (df)
   ID   Name  SchoolID  Grade    Major  Is_duplicated
0   1  Alice  School_1     10  Physics           True
1   2    Bob  School_1      8  Biology          False
2   3  Alice  School_2     10  Physics          False
3   4  Alice  School_1     10  Physics           True

원하는 경우 Yes및 No추가 numpy.where:

mask = df.duplicated(keep=False, subset=['Name','Grade','Major','SchoolID'])
df['Is_duplicated'] = np.where(mask, 'Yes', 'No')
print (df)
   ID   Name  SchoolID  Grade    Major Is_duplicated
0   1  Alice  School_1     10  Physics           Yes
1   2    Bob  School_1      8  Biology            No
2   3  Alice  School_2     10  Physics            No
3   4  Alice  School_1     10  Physics           Yes

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-2

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

데이터 프레임에서 중복 된 목록 찾기

데이터 프레임에서 중복 된 목록 찾기

Pandas 데이터 프레임의 목록에서 중복 된 값 제거

중첩 된 목록에서 빈 데이터 프레임 제거

목록보기에 입력 된 중복 데이터 방지

데이터 프레임에 중첩 된 목록 변수에서 부분 집합 화 및 바꾸기

중첩 된 목록을 기반으로 JSON 빌드에서 Pandas 데이터 프레임 만들기

데이터 프레임 목록의 동일한 열에서 중복 된 모든 값을 찾아 NULL로 변환합니다.

Pandas의 데이터 프레임에 중첩 된 문서에서 찾기

Python의 데이터 프레임에 중첩 된 목록 요소

데이터 프레임에 중첩 된 목록

Pandas 데이터 프레임 열에서 중복 된 값 바꾸기

팬더를 사용하여 데이터 프레임에서 중복 된 문장 수 찾기

purrr을 사용하여 중첩 된 데이터 프레임 목록 쌓기

목록 열에서 집계 된 데이터 프레임 만들기

R 데이터 프레임에서 명명 된 목록 만들기

한 속성에 중복 값이 포함 된 목록에서 개체 찾기

데이터 프레임 열에서 목록의 단어 찾기

업데이트 된 데이터가있는 테이블이있는 경우 MySql에서 중복 항목 찾기

R의 데이터 프레임에서 복잡한 목록 구조 만들기

데이터 프레임 업데이트 # 1을 생성하기 위해 딕셔너리 내에서 중첩 된 목록의 값 하나만 가져옵니다.

데이터 프레임 목록의 행을 반복하고 데이터를 추출합니다. (중첩 된 "적용"기능)

중첩 된 dict에서 Pandas 데이터 프레임 만들기

R에서 중첩 된 데이터 프레임 초기화

중첩 된 사전 목록에서 중첩 된 열로 팬더 데이터 프레임을 만드는 방법

중첩 된 목록에 포함 된 데이터 프레임에서 두 개의 열 추출

R에 중첩 된 데이터 프레임이있는 unest 목록

중첩 된 목록을 데이터 프레임으로 변환

목록 목록에서 데이터 프레임 만들기

Pandas 데이터 프레임에서 중복 된 요소 계산

r의 중첩 된 데이터 프레임 목록에 함수 적용