개수에 따라 Pandas 데이터 프레임에서 임의의 행 선택

debugcn 에 게시 Dev

아비 섹 타쿠 르

다음과 같은 팬더 데이터 프레임이 있습니다.

col1, col2, label
a,    b   , cat
b,    b1, , mouse
.
.
.........., elephant
.........., mouse

및 value_counts레이블 열 :

df.dataframe.value_counts:

cat: 7599
mouse: 6458
dog: 5100
elephant: 5000

내 value_counts가 다음과 같이되도록 각 레이블 범주에서 무작위로 N 개 이상의 행을 선택하고 싶습니다.

cat: N
mouse: N
dog: N
elephant: N

이 작업을 수행하는 "판도적인"방법이 있습니까?

MaxU

먼저 sample (frac = 1) 방법을 사용하여 DF를 섞은 다음 각 그룹에서 처음 N 개 행을 선택할 수 있습니다 (으로 그룹화 됨 label).

df.sample(frac=1).groupby('label', sort=False).head(N)

데모:

In [108]: df.sample(frac=1).groupby('label', sort=False).head(3)
Out[108]:
    col1 label
11     9     a
28     4     a
58     0     a
96     5     c
99     3     b
35     6     c
88     8     c
97     9     b
83     7     b

설정:

In [106]: df = pd.DataFrame({'label':np.random.choice(list('abc'), 100), 'col1':np.random.randint(0, 10, 100)})

In [107]: df
Out[107]:
    col1 label
0      4     c
1      6     b
2      9     c
3      0     b
4      5     a
5      3     a
6      3     b
7      6     c
8      7     b
9      6     a
..   ...   ...
90     4     b
91     5     b
92     8     c
93     2     c
94     9     a
95     2     a
96     5     c
97     9     b
98     8     b
99     3     b

[100 rows x 2 columns]

힌트 : 가능한 최대 N을 찾으려면 다음 코드를 사용할 수 있습니다 ( 아이디어에 대해 @NickilMaveli 에게 감사드립니다 ).

N = df.label.value_counts(sort=False).min()  # (or) df.label.value_counts().iloc[-1]

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-06-16

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

개수에 따라 Pandas 데이터 프레임에서 임의의 행 선택

개수에 따라 Pandas 데이터 프레임에서 임의의 행 선택

기준에 따라 Pandas 데이터 프레임의 열 선택

다른 열의 문자열 조각에 따라 pandas 데이터 프레임의 열에서 데이터 선택

Pandas 데이터 프레임의 조건에 따라 행 삭제

기준에 따라 데이터 프레임에서 행 선택 및 수정

여러 조건에 따라 2 개의 데이터 프레임에서 행 선택

R : 조건에 따라 데이터 프레임의 중복 행 선택

Pandas 데이터 프레임은 데이터 프레임 내에서 조건에 따라 선택한 행에만 람다를 적용합니다.

R에서 행 또는 열의 범주에 따라 데이터 프레임의 요소 선택

조건에 따라 두 데이터 프레임에서 행 연결 및 선택

Pandas 데이터 프레임에서 특정 행 선택

Pandas 데이터 프레임의 특정 조건에 따라 행 필터링

Pandas에서 다른 데이터 프레임의 열 이름에 행 이름이있는 경우 데이터 프레임의 행 값을 선택합니다.

행 인덱스 값에 따라 Pandas 데이터 프레임 열의 합계 값

조건에 따라 데이터 프레임 행 필터링 Pandas

행 인덱스의 조건에 따라 Pandas 데이터 프레임에서 행을 삭제하는 방법

Pandas의 데이터 프레임에서 Vlaues 선택

Python Pandas-두 행 사이의 데이터 프레임에서 무작위로 행 선택

Pandas : 데이터 프레임에서 행을 선택할 수 없습니다.

Pandas의 다중 열에 따라 데이터 프레임을 빠르게 선택하는 방법

날짜에 따라 Pandas 데이터 프레임에서 행 삭제

조건에 따라 Pandas 데이터 프레임에서 행 삭제

python, pandas에서 다른 데이터 프레임의 여러 열을 사용하여 한 데이터 프레임의 행 선택

Pandas : 필터링 된 데이터 프레임에서 행 범위 및 열 선택

Pandas의 데이터 프레임 행에서 데이터 프레임 열

Pandas의 데이터 프레임 행에서 데이터 프레임 열

Pandas 데이터 프레임의 범주 (열)에서 상위 n 개 행을 선택하고 이에 대한 계산을 수행합니다.

조건에 따라 데이터 프레임에서 행 선택 및 기능 적용

Pandas 데이터 프레임에서 선택 열을 행으로 쌓기

Pandas를 사용하여 데이터 프레임에서 행 선택 / 추출