그룹화 후 여러 열에 대한 t 테스트

제이슨 골

팬더에서 여러 열의 두 그룹의 평균을 계산하고 테스트하고 싶습니다. 계산 부분을 작업 할 수는 있지만 지금까지 테스트 부분에 대한 좋은 해결책은 없습니다. 아래는 장난감 샘플과 내가 원하는 결과입니다.

df = pd.DataFrame(np.random.randint(0,100,size=(100, 2)), columns=['col_1','col_2'])
df['group'] = ['A']*50 + ['B']*50

df.groupby('group').agg({"col_1":"mean","col_2":"mean"})

       col_1  col_2
group              
A      52.26  56.58
B      53.04  49.18

내가 갖고 싶은 것 :

       col_1  t_col_1  col_2 t_col_2
group              
A      52.26  4.3***   56.58 0.8
B      53.04  4.3***   49.18 0.8

하는 t_col_1수단의 차이 t 통계 인 col_1그룹 A와 그룹 B, 익스플로러 t.test(df.loc[df['group'].isin(['B'])][col_1], df.loc[df['group'].isin(['A'])][col_1]). 별은 필요하지 않지만 거기에있을 수 있다면 좋을 것입니다.

이를 수행하는 방법에 대한 제안 사항이 있습니까?

바쁜 곰

열을 반복하고 그룹별로 t 테스트를 수행 할 수 있습니다.

import pandas as pd
import scipy.stats as stats

tstats = {}
ix_a = df['group'] == 'A'
for x in df:
    if x != 'group':
        tstats['t_' + x] = stats.ttest_ind(df[x][ix_a], df[x][~ix_a])[0]

df.groupby('group').mean().assign(**tstats)

결과:

       col_1  col_2  t_col_1   t_col_2
group                                 
A      56.24  46.84  0.85443 -0.281279
B      51.24  48.42  0.85443 -0.281279

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

R : 여러 열로 그룹화 한 후 Dplyr 지연 변수

분류에서Dev

여러 열에 의한 SQL 그룹화

분류에서Dev

여러 클래스에 대한 T- 테스트 (> 2)

분류에서Dev

그룹화 기준으로 여러 테이블에 대한 MySql 쿼리

분류에서Dev

여러 열로 그룹화 한 후 이동 창 평균을 얻는 방법

분류에서Dev

여러 시계열에 대한 그룹화 및 집계

분류에서Dev

Julia의 그룹화 된 열에 대한 여러 요약 통계

분류에서Dev

Pandas의 여러 열에 대한 그룹화 된 집계

분류에서Dev

kdb + : 여러 열에 대한 그룹화 및 합계

분류에서Dev

여러 열 조합에 대한 R 그룹화

분류에서Dev

셀을 그룹화하여 팬더 열에 대한 히스토그램

분류에서Dev

MySQL : 그룹 절에 대한 여러 열

분류에서Dev

여러 인덱스에 의한 합산 및 그룹화 Pandas

분류에서Dev

그룹화 후 열에 대한 원래 값 추가

분류에서Dev

여러 열로 그룹화 된 데이터에 대한 하나의 열에 대한 ggplot2 막대 차트 레이블

분류에서Dev

여러 열을 사용하는 여러 테이블에 대해 그룹화를 사용하는 방법

분류에서Dev

HDFStore의 대용량 데이터에 대한 여러 열 "그룹화"

분류에서Dev

HDFStore의 대용량 데이터에 대한 여러 열 "그룹화"

분류에서Dev

PowerBI : 여러 열에 대해 개별적으로 그룹화하면서 테이블의 열에 대한 고유 개수를 얻는 방법

분류에서Dev

여러 열에 대한 Groupby 후 추가

분류에서Dev

여러 열로 그룹화하고 그룹당 제한-Postgres

분류에서Dev

그룹화가 필요한 여러 행의 동일한 열 값에 대한 테이블에서 추세를 얻는 방법

분류에서Dev

여러 필드에 대한 SSRS 보고서 그룹화

분류에서Dev

dplyr : 함수의 여러 변수에 대한 그룹화

분류에서Dev

MongoDb의 여러 필드에 대한 그룹화

분류에서Dev

여러 포함 된 문서에 대한 Mongoid 그룹화

분류에서Dev

C #의 여러 열에 대한 구조체 목록 별 그룹화

분류에서Dev

날짜 시간이있는 여러 열에 대한 그룹화 기준

분류에서Dev

팬더는 그룹화 후 여러 열을 합산합니다.

Related 관련 기사

  1. 1

    R : 여러 열로 그룹화 한 후 Dplyr 지연 변수

  2. 2

    여러 열에 의한 SQL 그룹화

  3. 3

    여러 클래스에 대한 T- 테스트 (> 2)

  4. 4

    그룹화 기준으로 여러 테이블에 대한 MySql 쿼리

  5. 5

    여러 열로 그룹화 한 후 이동 창 평균을 얻는 방법

  6. 6

    여러 시계열에 대한 그룹화 및 집계

  7. 7

    Julia의 그룹화 된 열에 대한 여러 요약 통계

  8. 8

    Pandas의 여러 열에 대한 그룹화 된 집계

  9. 9

    kdb + : 여러 열에 대한 그룹화 및 합계

  10. 10

    여러 열 조합에 대한 R 그룹화

  11. 11

    셀을 그룹화하여 팬더 열에 대한 히스토그램

  12. 12

    MySQL : 그룹 절에 대한 여러 열

  13. 13

    여러 인덱스에 의한 합산 및 그룹화 Pandas

  14. 14

    그룹화 후 열에 대한 원래 값 추가

  15. 15

    여러 열로 그룹화 된 데이터에 대한 하나의 열에 대한 ggplot2 막대 차트 레이블

  16. 16

    여러 열을 사용하는 여러 테이블에 대해 그룹화를 사용하는 방법

  17. 17

    HDFStore의 대용량 데이터에 대한 여러 열 "그룹화"

  18. 18

    HDFStore의 대용량 데이터에 대한 여러 열 "그룹화"

  19. 19

    PowerBI : 여러 열에 대해 개별적으로 그룹화하면서 테이블의 열에 대한 고유 개수를 얻는 방법

  20. 20

    여러 열에 대한 Groupby 후 추가

  21. 21

    여러 열로 그룹화하고 그룹당 제한-Postgres

  22. 22

    그룹화가 필요한 여러 행의 동일한 열 값에 대한 테이블에서 추세를 얻는 방법

  23. 23

    여러 필드에 대한 SSRS 보고서 그룹화

  24. 24

    dplyr : 함수의 여러 변수에 대한 그룹화

  25. 25

    MongoDb의 여러 필드에 대한 그룹화

  26. 26

    여러 포함 된 문서에 대한 Mongoid 그룹화

  27. 27

    C #의 여러 열에 대한 구조체 목록 별 그룹화

  28. 28

    날짜 시간이있는 여러 열에 대한 그룹화 기준

  29. 29

    팬더는 그룹화 후 여러 열을 합산합니다.

뜨겁다태그

보관