그룹화 후 여러 열에 대한 t 테스트

debugcn 에 게시 Dev

제이슨 골

팬더에서 여러 열의 두 그룹의 평균을 계산하고 테스트하고 싶습니다. 계산 부분을 작업 할 수는 있지만 지금까지 테스트 부분에 대한 좋은 해결책은 없습니다. 아래는 장난감 샘플과 내가 원하는 결과입니다.

df = pd.DataFrame(np.random.randint(0,100,size=(100, 2)), columns=['col_1','col_2'])
df['group'] = ['A']*50 + ['B']*50

df.groupby('group').agg({"col_1":"mean","col_2":"mean"})

       col_1  col_2
group              
A      52.26  56.58
B      53.04  49.18

내가 갖고 싶은 것 :

       col_1  t_col_1  col_2 t_col_2
group              
A      52.26  4.3***   56.58 0.8
B      53.04  4.3***   49.18 0.8

하는 t_col_1수단의 차이 t 통계 인 col_1그룹 A와 그룹 B, 익스플로러 t.test(df.loc[df['group'].isin(['B'])][col_1], df.loc[df['group'].isin(['A'])][col_1]). 별은 필요하지 않지만 거기에있을 수 있다면 좋을 것입니다.

이를 수행하는 방법에 대한 제안 사항이 있습니까?

바쁜 곰

열을 반복하고 그룹별로 t 테스트를 수행 할 수 있습니다.

import pandas as pd
import scipy.stats as stats

tstats = {}
ix_a = df['group'] == 'A'
for x in df:
    if x != 'group':
        tstats['t_' + x] = stats.ttest_ind(df[x][ix_a], df[x][~ix_a])[0]

df.groupby('group').mean().assign(**tstats)

결과:

       col_1  col_2  t_col_1   t_col_2
group                                 
A      56.24  46.84  0.85443 -0.281279
B      51.24  48.42  0.85443 -0.281279

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-1

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

그룹화 후 여러 열에 대한 t 테스트

그룹화 후 여러 열에 대한 t 테스트

R : 여러 열로 그룹화 한 후 Dplyr 지연 변수

여러 열에 의한 SQL 그룹화

여러 클래스에 대한 T- 테스트 (> 2)

그룹화 기준으로 여러 테이블에 대한 MySql 쿼리

여러 열로 그룹화 한 후 이동 창 평균을 얻는 방법

여러 시계열에 대한 그룹화 및 집계

Julia의 그룹화 된 열에 대한 여러 요약 통계

Pandas의 여러 열에 대한 그룹화 된 집계

kdb + : 여러 열에 대한 그룹화 및 합계

여러 열 조합에 대한 R 그룹화

셀을 그룹화하여 팬더 열에 대한 히스토그램

MySQL : 그룹 절에 대한 여러 열

여러 인덱스에 의한 합산 및 그룹화 Pandas

그룹화 후 열에 대한 원래 값 추가

여러 열로 그룹화 된 데이터에 대한 하나의 열에 대한 ggplot2 막대 차트 레이블

여러 열을 사용하는 여러 테이블에 대해 그룹화를 사용하는 방법

HDFStore의 대용량 데이터에 대한 여러 열 "그룹화"

HDFStore의 대용량 데이터에 대한 여러 열 "그룹화"

PowerBI : 여러 열에 대해 개별적으로 그룹화하면서 테이블의 열에 대한 고유 개수를 얻는 방법

여러 열에 대한 Groupby 후 추가

여러 열로 그룹화하고 그룹당 제한-Postgres

그룹화가 필요한 여러 행의 동일한 열 값에 대한 테이블에서 추세를 얻는 방법

여러 필드에 대한 SSRS 보고서 그룹화

dplyr : 함수의 여러 변수에 대한 그룹화

MongoDb의 여러 필드에 대한 그룹화

여러 포함 된 문서에 대한 Mongoid 그룹화

C #의 여러 열에 대한 구조체 목록 별 그룹화

날짜 시간이있는 여러 열에 대한 그룹화 기준

팬더는 그룹화 후 여러 열을 합산합니다.