python panda 데이터 구조에서 중복되는 항목 찾기

debugcn 에 게시 Dev

사용자 781486

csv 파일이 있습니다. 다음과 같이 보입니다.

name,id,
AAA,1111,
BBB,2222,
CCC,3333,
DDD,2222,

열에 중복이 있는지 확인하고 싶습니다 id. 그렇다면 중복을 찾으십시오. 이 경우 대답은 2222입니다.

중복이 있는지 확인하는 코드가 있습니다. 여기있어;

import pandas as pd
csv_file = 'C:/test.csv'
df = pd.read_csv(csv_file)
df['id'].duplicated().any()

문제는 중복을 어떻게 찾을 수 있는가?

python 2.7과 panda를 사용하고 있습니다.

이스 르엘

사용할 수 있다고 생각합니다 duplicated( 기본값 keep이기 때문에 생략 keep='first'). 또는 값이 필요한 경우 tolist:

print df['id'][df.duplicated(subset=['id'])]
3    2222
Name: id, dtype: int64

print df['id'][df.duplicated(subset=['id'])].tolist()
[2222]

다음을 확인할 수 있습니다 duplicated.

print df.duplicated(subset=['id'], keep='first')
0    False
1    False
2    False
3     True
dtype: bool

print df.duplicated(subset=['id'], keep='last')
0    False
1     True
2    False
3    False
dtype: bool

print df.duplicated(subset=['id'], keep=False)
0    False
1     True
2    False
3     True
dtype: bool

중복 행이 필요한 경우 하위 집합을 사용하십시오.

print df[df.duplicated(subset=['id'], keep='first')]
  name    id
3  DDD  2222

print df[df.duplicated(subset=['id'], keep='last')]
  name    id
1  BBB  2222

print df[df.duplicated(subset=['id'], keep=False)]
  name    id
1  BBB  2222
3  DDD  2222

drop_duplicates드롭에 사용 :

print df.drop_duplicates(subset=['id'], keep='first')
  name    id
0  AAA  1111
1  BBB  2222
2  CCC  3333

print df.drop_duplicates(subset=['id'], keep='last')
  name    id
0  AAA  1111
2  CCC  3333
3  DDD  2222

print df.drop_duplicates(subset=['id'], keep=False)
  name    id
0  AAA  1111
2  CCC  3333

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-06-6

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

python panda 데이터 구조에서 중복되는 항목 찾기

python panda 데이터 구조에서 중복되는 항목 찾기

python panda 데이터 구조에서 중복 확인

Java로 두 배열 사이에서 중복되지 않는 항목 찾기

업데이트 된 데이터가있는 테이블이있는 경우 MySql에서 중복 항목 찾기

중첩 된 데이터 구조에서 첫 번째 항목에 대한 경로 찾기

데이터 테이블에 항목이없는 요일 찾기

목록 및 데이터 프레임에 대한 이중 루프 Python Panda

데이터 세트에서 중복 항목을 찾고 주문하는 방법

Pandas 데이터 프레임에서 처음 반복되는 연속 항목 찾기

Python에서 중복 항목의 색인 찾기

이진 트리 구조 체계에서 항목 목록 찾기

특정 필드에 대한 데이터베이스에서 중복 항목 찾기

Python-중복되지 않는 문자열 목록에서 문자 찾기

데이터 프레임에서 중복 된 목록 찾기

감속기 상태에서 중첩 된 데이터 구조에 새 항목 추가

데이터 구조에 항목 추가가 중복됩니다.

MS SQL에서 특정 중복 항목 찾기 및 업데이트

배열에서 중복 항목 찾기

목록에서 항목 길이 찾기 [Python]

데이터 목록에서 RecyclerView의 항목 위치 찾기

Excel 데이터 연결-원본에 중복 항목이 없을 때 중복 항목 가져 오기

Panda 데이터 프레임에서 공통 요소 찾기

Python : 목록에서 항목 찾기

Python : 목록에서 항목 찾기

Python : 목록에서 중복 찾기

Python : 목록에서 중복 찾기

Python : 목록 목록에서 길이에 상관없이 조합이 가장 자주 발생하는 항목 찾기

Pandas 데이터 프레임에서 연속되는 항목의 시작 및 끝 인덱스 찾기

Python의 목록간에 공통되지 않은 항목 찾기

쉼표로 구분 된 데이터베이스 열에서 항목 찾기