R에서 순서 로지스틱 회귀 및 다중 공선성에 대한 VIF 계산

Hugo Perrichon

서수 회귀 모델을 실행하고 있습니다. 8 개의 설명 변수가 있는데, 그 중 4 개는 범주 형 ( '0' 또는 '1' ), 4 개는 연속적입니다. 사전에 다중 공선 성이 없는지 확인하고 싶으므로 분산 팽창 계수 ( 자동차 패키지의 vif 함수 )를 사용합니다.

mod1<-polr(Y ~ X1+X2+X3+X4+X5+X6+X7+X8, Hess = T, data=df)
vif(mod1)

그러나 변수 중 하나에 대해 VIF 값이 125이고 다음 경고가 표시됩니다.

경고 메시지 : In vif.default (mod1) : 인터셉트 없음 : vifs가 적절하지 않을 수 있습니다.

그러나 내 종속 변수를 요인 대신 숫자로 변환하고 선형 모델에서 동일한 작업을 수행 할 때 :

mod2<-lm(Y ~ X1+X2+X3+X4+X5+X6+X7+X8, data=df)
vif(mod2)

이번에는 모든 VIF 값이 3 미만이므로 다중 공선 성이 없음을 나타냅니다.

vif 함수 에 대해 혼란 스럽습니다 . 한 모델에 대해 100보다 큰 VIF를 반환하고 다른 모델에 대해 낮은 VIF를 반환하는 방법은 무엇입니까? 두 번째 결과를 고수하고 어쨌든 서수 모델을 수행해야합니까?

DaveArmstrong

vif()함수는 매개 변수 (및 그 하위 집합)의 상관 행렬의 결정자를 사용하여 VIF를 계산합니다. 선형 모델에서는 회귀 계수 만 포함됩니다 (절편 제외). 그만큼vif()함수는 정렬 된 로짓 모델과 함께 사용하기위한 것이 아닙니다. 따라서 매개 변수의 분산-공분산 행렬을 찾을 때 일반적으로 선형 모델에서 함수에 의해 제외되는 임계 값 매개 변수 (예 : 절편)를 포함합니다. 이것이 경고를받는 이유입니다. 임계 값 매개 변수를 찾아 제거하는 것을 알지 못합니다. VIF는 실제로 설계 행렬의 상호 상관 함수이기 때문에 (종속 변수 또는 선형 예측 변수에서 응답 변수 공간으로의 비선형 매핑에 의존하지 않습니다. glm]), lm()종속 변수의 숫자 버전을 사용하여 위의 두 번째 솔루션으로 정답을 얻어야합니다 .

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

로지스틱 회귀에서 다양한 기울기 계산

분류에서Dev

다중 다변량 회귀에 대한 VIF 테스트

분류에서Dev

파이썬에서 l 로지스틱 회귀를 사용한 베타 계수 및 p- 값

분류에서Dev

rms를 사용하여 로지스틱 회귀에 대한 OR 계산

분류에서Dev

단순 로지스틱 회귀에 대한 Optim.jl

분류에서Dev

다중 선형 회귀에 대한 예측 계산

분류에서Dev

다항 로지스틱 회귀에 대한 Keras model.predict

분류에서Dev

Python에서 로지스틱 회귀를위한 다항식 기능 조정

분류에서Dev

Pytorch에서 로지스틱 회귀를 사용한 예측은 무한대를 반환합니다.

분류에서Dev

tensorflow에서 로지스틱 회귀 모델의 계수

분류에서Dev

R의 다중 회귀에서 "회귀선"플로팅

분류에서Dev

200 개 데이터 세트에 대한 비교 ANN 및 로지스틱 회귀

분류에서Dev

Python에서 Sklearn을 사용한 로지스틱 회귀 함수

분류에서Dev

ROC 곡선을 사용하여 R에서 가중치 이진 로지스틱 회귀 (glm)에 대한 최적 컷오프 찾기

분류에서Dev

R의 glm에서 "weights"인수를 사용하는 로지스틱 회귀에 대한 ROC 곡선 수행

분류에서Dev

TensorFlow에 의한 로지스틱 회귀

분류에서Dev

로지스틱 회귀에서 순위 데이터 사용

분류에서Dev

R에서 glm 캐럿 모델에 대한 분산 팽창 VIF

분류에서Dev

비선형 데이터에 대한 로지스틱 회귀

분류에서Dev

R Shiny에서 로지스틱 회귀 생성

분류에서Dev

R에 대한 로지스틱 회귀에 대한 효과 크기를 계산하는 방법은 무엇입니까?

분류에서Dev

요약 통계를 얻기위한 SNP 목록에 대한 R의 로지스틱 회귀

분류에서Dev

R에서 로지스틱 회귀 플로팅하기

분류에서Dev

로지스틱 회귀에서 가중치를 사용하는 방법

분류에서Dev

로지스틱 회귀-R에서 참조 수준 정의

분류에서Dev

로지스틱 회귀에 대한 glm ()의 결과

분류에서Dev

단일 주제 데이터에 대한 로지스틱 회귀?

분류에서Dev

주식에 대한 로지스틱 회귀 모델 구축

분류에서Dev

수치 예측 변수에 대한 로지스틱 회귀?

Related 관련 기사

  1. 1

    로지스틱 회귀에서 다양한 기울기 계산

  2. 2

    다중 다변량 회귀에 대한 VIF 테스트

  3. 3

    파이썬에서 l 로지스틱 회귀를 사용한 베타 계수 및 p- 값

  4. 4

    rms를 사용하여 로지스틱 회귀에 대한 OR 계산

  5. 5

    단순 로지스틱 회귀에 대한 Optim.jl

  6. 6

    다중 선형 회귀에 대한 예측 계산

  7. 7

    다항 로지스틱 회귀에 대한 Keras model.predict

  8. 8

    Python에서 로지스틱 회귀를위한 다항식 기능 조정

  9. 9

    Pytorch에서 로지스틱 회귀를 사용한 예측은 무한대를 반환합니다.

  10. 10

    tensorflow에서 로지스틱 회귀 모델의 계수

  11. 11

    R의 다중 회귀에서 "회귀선"플로팅

  12. 12

    200 개 데이터 세트에 대한 비교 ANN 및 로지스틱 회귀

  13. 13

    Python에서 Sklearn을 사용한 로지스틱 회귀 함수

  14. 14

    ROC 곡선을 사용하여 R에서 가중치 이진 로지스틱 회귀 (glm)에 대한 최적 컷오프 찾기

  15. 15

    R의 glm에서 "weights"인수를 사용하는 로지스틱 회귀에 대한 ROC 곡선 수행

  16. 16

    TensorFlow에 의한 로지스틱 회귀

  17. 17

    로지스틱 회귀에서 순위 데이터 사용

  18. 18

    R에서 glm 캐럿 모델에 대한 분산 팽창 VIF

  19. 19

    비선형 데이터에 대한 로지스틱 회귀

  20. 20

    R Shiny에서 로지스틱 회귀 생성

  21. 21

    R에 대한 로지스틱 회귀에 대한 효과 크기를 계산하는 방법은 무엇입니까?

  22. 22

    요약 통계를 얻기위한 SNP 목록에 대한 R의 로지스틱 회귀

  23. 23

    R에서 로지스틱 회귀 플로팅하기

  24. 24

    로지스틱 회귀에서 가중치를 사용하는 방법

  25. 25

    로지스틱 회귀-R에서 참조 수준 정의

  26. 26

    로지스틱 회귀에 대한 glm ()의 결과

  27. 27

    단일 주제 데이터에 대한 로지스틱 회귀?

  28. 28

    주식에 대한 로지스틱 회귀 모델 구축

  29. 29

    수치 예측 변수에 대한 로지스틱 회귀?

뜨겁다태그

보관