높은 카디널 기능과 낮은 카디널 기능이 여러 개 있습니다. 대상 기능은 숫자입니다. 아래 코드를 통해 낮은 카디널 기능과 대상 변수의 상관 관계를 알 수 있습니다.
F, p = stats.f_oneway(df[df.some_variable=='value_1'].Target,df[df.some_variable=='value_2'].Target)
print(F)
여기서 위의 기능은 낮은 추기경이며 두 개의 고유 한 값만 있습니다. 기능의 카디널리티가 높은 경우 (예 : 400 개의 고유 값) 상관 관계를 어떻게 찾을 수 있습니까? 어떤 제안과 대안 아이디어라도 감사합니다. 기다려 주셔서 감사합니다
vals
값 목록 이라고 가정
df_arr = [df[df.some_variable==val].Target for val in vals]
F, p = stats.f_oneway(*df_arr)
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다