그룹화 된 평균을 기준으로 누락 된 값을 채우는 방법은 무엇입니까?

debugcn 에 게시 Dev

엘리 비에 섹

내 데이터에 '연령'에 대한 결 측값이 있으며 그룹 별 열 '제목'을 기준으로 평균으로 바꾸고 싶습니다. 명령 후 :

df.groupby('Title').mean()['Age']

예를 들어 목록을 얻습니다.

미스터 32

미스 21.7

양 28

기타

나는 시도했다 :

df['Age'].replace(np.nan, 0, inplace=True)
df[(df.Age==0.0)&(df.Title=='Mr')]

나이가없고 제목이 한 가지 유형이지만 작동하지 않는 셀만 볼 수 있습니다.

질문 1. 여러 셀이 동시에 두 조건을 모두 충족하더라도 위 코드에 아무 셀도 표시되지 않는 이유 (연령 = 0.0, 제목은 mr)

질문 2. 위에 설명 된대로 그룹 평균을 기반으로 모든 결 측값을 어떻게 바꿀 수 있습니까?

StupidWolf

첫 번째 오류를 재현 할 수 없으므로 아래와 같은 예를 사용하면 :

import pandas as pd
import numpy as np
np.random.seed(111)
df = pd.DataFrame({'Title':np.random.choice(['Mr','Miss','Mrs'],20),'Age':np.random.randint(20,50,20)})
df.loc[[5,9,10,11,12],['Age']]=np.nan

데이터 프레임은 다음과 같습니다.

Title   Age
0   Mr  42.0
1   Mr  28.0
2   Mr  25.0
3   Mr  32.0
4   Mrs 26.0
5   Miss    NaN
6   Mrs 32.0
7   Mrs 33.0
8   Mrs 25.0
9   Mr  NaN
10  Miss    NaN
11  Mr  NaN
12  Mrs NaN
13  Miss    38.0
14  Mr  31.0
15  Mr  42.0
16  Mr  24.0
17  Mrs 23.0
18  Mrs 49.0
19  Miss    27.0

그리고 한 단계 만 더 수행하여 교체 할 수 있습니다.

ave_age = df.groupby('Title').mean()['Age']
df.loc[pd.isna(df['Age']),'Age'] = ave_age[df.loc[pd.isna(df['Age']),'Title']].values

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-2

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

그룹화 된 평균을 기준으로 누락 된 값을 채우는 방법은 무엇입니까?

그룹화 된 평균을 기준으로 누락 된 값을 채우는 방법은 무엇입니까?

pandas에서 누락 된 값을 평균 ffill () 및 bfill ()으로 바꾸는 방법은 무엇입니까?

R에서 누락 된 값을 평균으로 대체하여 처리하는 방법은 무엇입니까?

R에서 그룹화 된 평균으로 NA 값을 채우는 방법

누락 된 NAN을 채우는 방법은 무엇입니까?

누락 된 값을 전날 값으로 채우는 방법은 무엇입니까? (dplyr -spread 사용)

다른 열의 값을 기준으로 누락 된 값을 채우는 방법

그룹 평균을 기반으로 DataFrame의 모든 누락 값 (모든 열)을 채우는 방법은 무엇입니까?

SataFrame에서 누락 된 값을 채우는 방법은 무엇입니까?

열로 그룹화 된 BigQuery에서 평균 시간을 찾는 방법은 무엇입니까?

D3.js : 연도 및 월별로 그룹화 된 평균을 찾는 방법은 무엇입니까?

ggplot : R의 그룹화 된 막대 차트에 그룹 평균 값을 선으로 추가하는 방법은 무엇입니까?

다른 열의 간격을 기반으로 Pandas의 다른 열을 기반으로 누락 된 값을 채우는 방법은 무엇입니까?

SQl Server에서 누락 된 행으로 인해 결과 집합을 채우는 방법은 무엇입니까?

Python을 사용하여 현재 값을 기반으로 누락 된 값을 채우는 방법은 무엇입니까?

사전 훈련 된 모델을 사용하여 누락 된 값을 채우는 방법은 무엇입니까?

Pandas를 사용하여 열 패턴을 기반으로 누락 된 값을 채우는 방법은 무엇입니까?

누락 된 숫자를 포함하는 각 행의 평균을 얻는 방법은 무엇입니까?

Pandas : 대규모 데이터 세트에서 누락 된 값을 채우는 방법은 무엇입니까?

SQL-식별 열로 그룹화 된 한 열의 가장 높은 값을 기준으로 정렬하는 방법은 무엇입니까?

그룹화 된 데이터에서 롤링 평균을 얻는 방법은 무엇입니까?

그룹화 된 데이터 프레임의 평균을 계산하는 방법은 무엇입니까?

BigQuery에서 선형 보간으로 불규칙적으로 누락 된 값을 채우는 방법은 무엇입니까?

그룹화 된 열을 잃지 않고 groupby 변환을 기반으로 NaN을 채우는 방법은 무엇입니까?

JQuery Mobile-그룹화 된 버튼을 수평 및 수직으로 만드는 방법은 무엇입니까?

Pandas : 다중 인덱스 시계열에서 누락 된 기간 / 날짜 / 시간 값을 채우는 방법은 무엇입니까?

dplyr을 사용하여 그룹화 된 데이터에서 값이 발생하는 경우 누락되지 않은 값 채우기

mysql에서 새 그룹으로 그룹화 된 행을 추가하는 방법은 무엇입니까?

위아래 행의 평균을 기준으로 열에서 누락 된 행 채우기

DataFrame에서 누락 된 행을 생성 / 채우는 방법은 무엇입니까?