python panda 데이터 구조에서 중복되는 항목 찾기

사용자 781486

csv 파일이 있습니다. 다음과 같이 보입니다.

name,id,
AAA,1111,
BBB,2222,
CCC,3333,
DDD,2222,

열에 중복이 있는지 확인하고 싶습니다 id. 그렇다면 중복을 찾으십시오. 이 경우 대답은 2222입니다.

중복이 있는지 확인하는 코드가 있습니다. 여기있어;

import pandas as pd
csv_file = 'C:/test.csv'
df = pd.read_csv(csv_file)
df['id'].duplicated().any()

문제는 중복을 어떻게 찾을 수 있는가?

python 2.7과 panda를 사용하고 있습니다.

이스 르엘

사용할 수 있다고 생각합니다 duplicated( 기본값 keep이기 때문에 생략 keep='first'). 또는 값이 필요한 경우 tolist:

print df['id'][df.duplicated(subset=['id'])]
3    2222
Name: id, dtype: int64

print df['id'][df.duplicated(subset=['id'])].tolist()
[2222]

다음을 확인할 수 있습니다 duplicated.

print df.duplicated(subset=['id'], keep='first')
0    False
1    False
2    False
3     True
dtype: bool

print df.duplicated(subset=['id'], keep='last')
0    False
1     True
2    False
3    False
dtype: bool

print df.duplicated(subset=['id'], keep=False)
0    False
1     True
2    False
3     True
dtype: bool

중복 행이 필요한 경우 하위 집합을 사용하십시오.

print df[df.duplicated(subset=['id'], keep='first')]
  name    id
3  DDD  2222

print df[df.duplicated(subset=['id'], keep='last')]
  name    id
1  BBB  2222

print df[df.duplicated(subset=['id'], keep=False)]
  name    id
1  BBB  2222
3  DDD  2222

drop_duplicates드롭에 사용 :

print df.drop_duplicates(subset=['id'], keep='first')
  name    id
0  AAA  1111
1  BBB  2222
2  CCC  3333

print df.drop_duplicates(subset=['id'], keep='last')
  name    id
0  AAA  1111
2  CCC  3333
3  DDD  2222

print df.drop_duplicates(subset=['id'], keep=False)
  name    id
0  AAA  1111
2  CCC  3333

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

python panda 데이터 구조에서 중복 확인

분류에서Dev

Java로 두 배열 사이에서 중복되지 않는 항목 찾기

분류에서Dev

업데이트 된 데이터가있는 테이블이있는 경우 MySql에서 중복 항목 찾기

분류에서Dev

중첩 된 데이터 구조에서 첫 번째 항목에 대한 경로 찾기

분류에서Dev

데이터 테이블에 항목이없는 요일 찾기

분류에서Dev

목록 및 데이터 프레임에 대한 이중 루프 Python Panda

분류에서Dev

데이터 세트에서 중복 항목을 찾고 주문하는 방법

분류에서Dev

Pandas 데이터 프레임에서 처음 반복되는 연속 항목 찾기

분류에서Dev

Python에서 중복 항목의 색인 찾기

분류에서Dev

이진 트리 구조 체계에서 항목 목록 찾기

분류에서Dev

특정 필드에 대한 데이터베이스에서 중복 항목 찾기

분류에서Dev

Python-중복되지 않는 문자열 목록에서 문자 찾기

분류에서Dev

데이터 프레임에서 중복 된 목록 찾기

분류에서Dev

감속기 상태에서 중첩 된 데이터 구조에 새 항목 추가

분류에서Dev

데이터 구조에 항목 추가가 중복됩니다.

분류에서Dev

MS SQL에서 특정 중복 항목 찾기 및 업데이트

분류에서Dev

배열에서 중복 항목 찾기

분류에서Dev

목록에서 항목 길이 찾기 [Python]

분류에서Dev

데이터 목록에서 RecyclerView의 항목 위치 찾기

분류에서Dev

Excel 데이터 연결-원본에 중복 항목이 없을 때 중복 항목 가져 오기

분류에서Dev

Panda 데이터 프레임에서 공통 요소 찾기

분류에서Dev

Python : 목록에서 항목 찾기

분류에서Dev

Python : 목록에서 항목 찾기

분류에서Dev

Python : 목록에서 중복 찾기

분류에서Dev

Python : 목록에서 중복 찾기

분류에서Dev

Python : 목록 목록에서 길이에 상관없이 조합이 가장 자주 발생하는 항목 찾기

분류에서Dev

Pandas 데이터 프레임에서 연속되는 항목의 시작 및 끝 인덱스 찾기

분류에서Dev

Python의 목록간에 공통되지 않은 항목 찾기

분류에서Dev

쉼표로 구분 된 데이터베이스 열에서 항목 찾기

Related 관련 기사

  1. 1

    python panda 데이터 구조에서 중복 확인

  2. 2

    Java로 두 배열 사이에서 중복되지 않는 항목 찾기

  3. 3

    업데이트 된 데이터가있는 테이블이있는 경우 MySql에서 중복 항목 찾기

  4. 4

    중첩 된 데이터 구조에서 첫 번째 항목에 대한 경로 찾기

  5. 5

    데이터 테이블에 항목이없는 요일 찾기

  6. 6

    목록 및 데이터 프레임에 대한 이중 루프 Python Panda

  7. 7

    데이터 세트에서 중복 항목을 찾고 주문하는 방법

  8. 8

    Pandas 데이터 프레임에서 처음 반복되는 연속 항목 찾기

  9. 9

    Python에서 중복 항목의 색인 찾기

  10. 10

    이진 트리 구조 체계에서 항목 목록 찾기

  11. 11

    특정 필드에 대한 데이터베이스에서 중복 항목 찾기

  12. 12

    Python-중복되지 않는 문자열 목록에서 문자 찾기

  13. 13

    데이터 프레임에서 중복 된 목록 찾기

  14. 14

    감속기 상태에서 중첩 된 데이터 구조에 새 항목 추가

  15. 15

    데이터 구조에 항목 추가가 중복됩니다.

  16. 16

    MS SQL에서 특정 중복 항목 찾기 및 업데이트

  17. 17

    배열에서 중복 항목 찾기

  18. 18

    목록에서 항목 길이 찾기 [Python]

  19. 19

    데이터 목록에서 RecyclerView의 항목 위치 찾기

  20. 20

    Excel 데이터 연결-원본에 중복 항목이 없을 때 중복 항목 가져 오기

  21. 21

    Panda 데이터 프레임에서 공통 요소 찾기

  22. 22

    Python : 목록에서 항목 찾기

  23. 23

    Python : 목록에서 항목 찾기

  24. 24

    Python : 목록에서 중복 찾기

  25. 25

    Python : 목록에서 중복 찾기

  26. 26

    Python : 목록 목록에서 길이에 상관없이 조합이 가장 자주 발생하는 항목 찾기

  27. 27

    Pandas 데이터 프레임에서 연속되는 항목의 시작 및 끝 인덱스 찾기

  28. 28

    Python의 목록간에 공통되지 않은 항목 찾기

  29. 29

    쉼표로 구분 된 데이터베이스 열에서 항목 찾기

뜨겁다태그

보관