개수에 따라 Pandas 데이터 프레임에서 임의의 행 선택

아비 섹 타쿠 르

다음과 같은 팬더 데이터 프레임이 있습니다.

col1, col2, label
a,    b   , cat
b,    b1, , mouse
.
.
.........., elephant
.........., mouse

value_counts레이블 열 :

df.dataframe.value_counts:

cat: 7599
mouse: 6458
dog: 5100
elephant: 5000

내 value_counts가 다음과 같이되도록 각 레이블 범주에서 무작위로 N 개 이상의 행을 선택하고 싶습니다.

cat: N
mouse: N
dog: N
elephant: N

이 작업을 수행하는 "판도적인"방법이 있습니까?

MaxU

먼저 sample (frac = 1) 방법을 사용하여 DF를 섞은 다음 각 그룹에서 처음 N 개 행을 선택할 수 있습니다 (으로 그룹화 됨 label).

df.sample(frac=1).groupby('label', sort=False).head(N)

데모:

In [108]: df.sample(frac=1).groupby('label', sort=False).head(3)
Out[108]:
    col1 label
11     9     a
28     4     a
58     0     a
96     5     c
99     3     b
35     6     c
88     8     c
97     9     b
83     7     b

설정:

In [106]: df = pd.DataFrame({'label':np.random.choice(list('abc'), 100), 'col1':np.random.randint(0, 10, 100)})

In [107]: df
Out[107]:
    col1 label
0      4     c
1      6     b
2      9     c
3      0     b
4      5     a
5      3     a
6      3     b
7      6     c
8      7     b
9      6     a
..   ...   ...
90     4     b
91     5     b
92     8     c
93     2     c
94     9     a
95     2     a
96     5     c
97     9     b
98     8     b
99     3     b

[100 rows x 2 columns]

힌트 : 가능한 최대 N을 찾으려면 다음 코드를 사용할 수 있습니다 ( 아이디어에 대해 @NickilMaveli 에게 감사드립니다 ).

N = df.label.value_counts(sort=False).min()  # (or) df.label.value_counts().iloc[-1]

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

기준에 따라 Pandas 데이터 프레임의 열 선택

분류에서Dev

다른 열의 문자열 조각에 따라 pandas 데이터 프레임의 열에서 데이터 선택

분류에서Dev

Pandas 데이터 프레임의 조건에 따라 행 삭제

분류에서Dev

기준에 따라 데이터 프레임에서 행 선택 및 수정

분류에서Dev

여러 조건에 따라 2 개의 데이터 프레임에서 행 선택

분류에서Dev

R : 조건에 따라 데이터 프레임의 중복 행 선택

분류에서Dev

Pandas 데이터 프레임은 데이터 프레임 내에서 조건에 따라 선택한 행에만 람다를 적용합니다.

분류에서Dev

R에서 행 또는 열의 범주에 따라 데이터 프레임의 요소 선택

분류에서Dev

조건에 따라 두 데이터 프레임에서 행 연결 및 선택

분류에서Dev

Pandas 데이터 프레임에서 특정 행 선택

분류에서Dev

Pandas 데이터 프레임의 특정 조건에 따라 행 필터링

분류에서Dev

Pandas에서 다른 데이터 프레임의 열 이름에 행 이름이있는 경우 데이터 프레임의 행 값을 선택합니다.

분류에서Dev

행 인덱스 값에 따라 Pandas 데이터 프레임 열의 합계 값

분류에서Dev

조건에 따라 데이터 프레임 행 필터링 Pandas

분류에서Dev

행 인덱스의 조건에 따라 Pandas 데이터 프레임에서 행을 삭제하는 방법

분류에서Dev

Pandas의 데이터 프레임에서 Vlaues 선택

분류에서Dev

Python Pandas-두 행 사이의 데이터 프레임에서 무작위로 행 선택

분류에서Dev

Pandas : 데이터 프레임에서 행을 선택할 수 없습니다.

분류에서Dev

Pandas의 다중 열에 따라 데이터 프레임을 빠르게 선택하는 방법

분류에서Dev

날짜에 따라 Pandas 데이터 프레임에서 행 삭제

분류에서Dev

조건에 따라 Pandas 데이터 프레임에서 행 삭제

분류에서Dev

python, pandas에서 다른 데이터 프레임의 여러 열을 사용하여 한 데이터 프레임의 행 선택

분류에서Dev

Pandas : 필터링 된 데이터 프레임에서 행 범위 및 열 선택

분류에서Dev

Pandas의 데이터 프레임 행에서 데이터 프레임 열

분류에서Dev

Pandas의 데이터 프레임 행에서 데이터 프레임 열

분류에서Dev

Pandas 데이터 프레임의 범주 (열)에서 상위 n 개 행을 선택하고 이에 대한 계산을 수행합니다.

분류에서Dev

조건에 따라 데이터 프레임에서 행 선택 및 기능 적용

분류에서Dev

Pandas 데이터 프레임에서 선택 열을 행으로 쌓기

분류에서Dev

Pandas를 사용하여 데이터 프레임에서 행 선택 / 추출

Related 관련 기사

  1. 1

    기준에 따라 Pandas 데이터 프레임의 열 선택

  2. 2

    다른 열의 문자열 조각에 따라 pandas 데이터 프레임의 열에서 데이터 선택

  3. 3

    Pandas 데이터 프레임의 조건에 따라 행 삭제

  4. 4

    기준에 따라 데이터 프레임에서 행 선택 및 수정

  5. 5

    여러 조건에 따라 2 개의 데이터 프레임에서 행 선택

  6. 6

    R : 조건에 따라 데이터 프레임의 중복 행 선택

  7. 7

    Pandas 데이터 프레임은 데이터 프레임 내에서 조건에 따라 선택한 행에만 람다를 적용합니다.

  8. 8

    R에서 행 또는 열의 범주에 따라 데이터 프레임의 요소 선택

  9. 9

    조건에 따라 두 데이터 프레임에서 행 연결 및 선택

  10. 10

    Pandas 데이터 프레임에서 특정 행 선택

  11. 11

    Pandas 데이터 프레임의 특정 조건에 따라 행 필터링

  12. 12

    Pandas에서 다른 데이터 프레임의 열 이름에 행 이름이있는 경우 데이터 프레임의 행 값을 선택합니다.

  13. 13

    행 인덱스 값에 따라 Pandas 데이터 프레임 열의 합계 값

  14. 14

    조건에 따라 데이터 프레임 행 필터링 Pandas

  15. 15

    행 인덱스의 조건에 따라 Pandas 데이터 프레임에서 행을 삭제하는 방법

  16. 16

    Pandas의 데이터 프레임에서 Vlaues 선택

  17. 17

    Python Pandas-두 행 사이의 데이터 프레임에서 무작위로 행 선택

  18. 18

    Pandas : 데이터 프레임에서 행을 선택할 수 없습니다.

  19. 19

    Pandas의 다중 열에 따라 데이터 프레임을 빠르게 선택하는 방법

  20. 20

    날짜에 따라 Pandas 데이터 프레임에서 행 삭제

  21. 21

    조건에 따라 Pandas 데이터 프레임에서 행 삭제

  22. 22

    python, pandas에서 다른 데이터 프레임의 여러 열을 사용하여 한 데이터 프레임의 행 선택

  23. 23

    Pandas : 필터링 된 데이터 프레임에서 행 범위 및 열 선택

  24. 24

    Pandas의 데이터 프레임 행에서 데이터 프레임 열

  25. 25

    Pandas의 데이터 프레임 행에서 데이터 프레임 열

  26. 26

    Pandas 데이터 프레임의 범주 (열)에서 상위 n 개 행을 선택하고 이에 대한 계산을 수행합니다.

  27. 27

    조건에 따라 데이터 프레임에서 행 선택 및 기능 적용

  28. 28

    Pandas 데이터 프레임에서 선택 열을 행으로 쌓기

  29. 29

    Pandas를 사용하여 데이터 프레임에서 행 선택 / 추출

뜨겁다태그

보관