여러 다른 "그룹"변수를 포함하는 데이터 세트가 있는데, 각각 자체 그룹의 하위 집합이 있습니다 (변수는 결국 groupX_1, groupX_2 .. GroupX_x, GroupY_1, GroupY_2, GroupY_x 등). 응답 변수도 있습니다. 어떤 그룹이 반응과 상관 관계가 있는지 확인하고 각 그룹과 반응에 대한 일련의 상관 행렬을 만들고 R에서 각각 cor 함수와 corrplot 함수를 사용하여 해당 상관 관계도를 생성했습니다 (다음 예 참조). :
제가하는 일의 목적 상, 저는 변수가 서로 상관 관계가 있는지 여부에 관심이없고, 변수가 반응 변수와 상관 관계가 있는지 여부에 관심이 있습니다. 응답 변수에 대한 그룹 만 포함하도록 플로팅하기 전에 상관 행렬을 필터링하는 방법이 있습니까?
cor(x)
함수는 하나의 인수 (행렬 또는 data.frame)가 주어지면 열에있는 모든 변수 쌍 간의 상관 관계를 계산합니다. 그러나 동일한 함수는 두 개의 인수를받을 수 있습니다. cor(x, y)
,이 경우 x와 y 쌍 간의 상관 관계 만 계산합니다.
따라서 귀하의 경우 모든 그룹 변수를 x로, 응답 변수를 y로 제공 한 다음 결과를 플로팅 할 수 있습니다 ( "response"가 마지막 열에 있다고 가정).
cors <- cor(dat[,-ncol(dat)], dat[,ncol(dat)])
corrplot::corrplot(cors)
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다