의사 결정 트리 가지 치기가 테스트 세트 및 훈련 세트의 정확성에 미치는 영향

가지 치기가 훈련 및 테스트 세트의 정확성에 미치는 영향에 대한 이해를 높이고 싶습니다.

나의 현재 이해는 가지 치기가 나무가 과적 합되는 것을 방지하기 때문에 테스트 세트의 정확도를 향상시킬 것이라는 것입니다. 이것이 올바른 생각입니까?

그리고 가지 치기는 훈련 세트의 정확성에 어떤 영향을 미칠까요? 정확도를 떨어 뜨리는 것 같지만 그 이유는 무엇입니까?

도움을 주시면 감사하겠습니다.

야투

트리가 훈련 세트에 대한 최적의 매개 변수 학습하지 않기 때문에 가지 치기는 훈련 세트의 정확도를 낮출 수 있습니다 . 그러나 적절한 매개 변수를 설정하여 과적 합을 극복하지 않으면 일반화에 실패 하는 모델을 구축하게 될 있습니다.

즉, 모델이 열차 데이터에서 완벽하게 예측하지만 보이지 않는 데이터로 일반화하지 못하는 지나치게 복잡한 함수를 학습했음을 의미합니다. 이는 훈련 세트가 더 낮을 때 더 문제가됩니다. 세트 자체가 미래에 올 수있는 새로운 샘플을 충분히 대표하지 못할 수 있기 때문입니다.

따라서 모델이 너무 복잡해지지 않도록 최대 깊이와 리프 수를 제한하기 위해 이러한 매개 변수를 관리해야합니다.

바이어스-분산 트레이드 오프에 대해서도 읽어 볼 수 있습니다 .

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

의사 결정 트리 가지 치기가 테스트 세트 및 훈련 세트의 정확성에 미치는 영향

분류에서Dev

훈련 중 비트 정밀도가 DNN의 정확도에 미치는 영향-양자화 된 유형으로 추론을 지원하는 라이브러리

분류에서Dev

셔플 훈련 데이터가 랜덤 포레스트 분류기의 정확도에 영향을 미치는 이유는 무엇입니까?

분류에서Dev

훈련 세트를 전치하면 SVM의 결과에 영향을 미칩니다

분류에서Dev

훈련 및 테스트 세트로의 분할을 포함한 이미지 데이터 세트 전처리

분류에서Dev

훈련 세트가 정규화되면 테스트 세트가해야 할 일

분류에서Dev

편향된 데이터 세트가있는 교육 의사 결정 트리

분류에서Dev

개인 세트, 작업 세트 및 가상 메모리 중 시스템 성능에 더 큰 영향을 미치는 것은 무엇입니까?

분류에서Dev

검증 세트가 훈련 세트의 일부입니까?

분류에서Dev

훈련 및 테스트 데이터 세트의 그룹간에 동일한 비율 유지

분류에서Dev

Haar Cascade의 여러 이미지에서 훈련 세트 만들기

분류에서Dev

SQL 데이터베이스에서 의사 결정 트리 분류기 훈련

분류에서Dev

교차 검증을 수행 할 때 훈련 및 테스트 세트의 클래스 분포가 전체 세트와 동일하다는 것을 확인하면 어떤 변화가 있습니까?

분류에서Dev

훈련 세트의 평균 오류가 테스트 세트의 평균 오류와 같습니까?

분류에서Dev

iOS, Swift 3의 특정 뷰 컨트롤러에 대한 가로 및 세로 장치 방향 지원

분류에서Dev

1 기가비트 라우터가 LAN에 미치는 영향

분류에서Dev

데이터 세트에서 RandomForestClassifer의 결과를 생성, 훈련 및 인쇄하는 방법

분류에서Dev

콘텐츠 신뢰를 활성화하는 Azure가 레지스트리의 기존 이미지에 영향을 미치나요?

분류에서Dev

UDE를 사용한 문자 집합 감지 및 텍스트를 문자열로 가져 오기-성능에 미치는 영향

분류에서Dev

R data.table에서 훈련 세트의 평균 및 표준 편차로 테스트 세트를 표준화하는 방법

분류에서Dev

Azure 부하 테스트. 가상 사용자가 성능에 미치는 영향 이해

분류에서Dev

별도의 데이터 프레임에서 훈련 세트와 테스트 세트를 지정하려면 어떻게해야합니까?

분류에서Dev

Bigquery : 데이터 세트에있는 엄청난 양의 테이블이 성능에 영향을 미치나요?

분류에서Dev

동일한 스트림에 StreamBuilder 사용 및 Firestore의 읽기 수에 미치는 영향

분류에서Dev

Random Forest는 훈련 및 테스트에서 98 %의 정확도를 얻지 만 그렇지 않으면 항상 동일한 클래스를 예측합니다.

분류에서Dev

대기 상태의 스레드가 Java 프로세스의 메모리에 미치는 영향

분류에서Dev

Caffe, AlexNet의 사전 훈련 된 가중치를 두 개의 AlexNet이있는 사용자 지정 네트워크에 복사

분류에서Dev

훈련 세트 크기와 훈련 Epoch 간의 관계

분류에서Dev

limits.conf의 설정은 init.d 스크립트로 시작된 프로세스에 영향을 미치지 않습니다.

Related 관련 기사

  1. 1

    의사 결정 트리 가지 치기가 테스트 세트 및 훈련 세트의 정확성에 미치는 영향

  2. 2

    훈련 중 비트 정밀도가 DNN의 정확도에 미치는 영향-양자화 된 유형으로 추론을 지원하는 라이브러리

  3. 3

    셔플 훈련 데이터가 랜덤 포레스트 분류기의 정확도에 영향을 미치는 이유는 무엇입니까?

  4. 4

    훈련 세트를 전치하면 SVM의 결과에 영향을 미칩니다

  5. 5

    훈련 및 테스트 세트로의 분할을 포함한 이미지 데이터 세트 전처리

  6. 6

    훈련 세트가 정규화되면 테스트 세트가해야 할 일

  7. 7

    편향된 데이터 세트가있는 교육 의사 결정 트리

  8. 8

    개인 세트, 작업 세트 및 가상 메모리 중 시스템 성능에 더 큰 영향을 미치는 것은 무엇입니까?

  9. 9

    검증 세트가 훈련 세트의 일부입니까?

  10. 10

    훈련 및 테스트 데이터 세트의 그룹간에 동일한 비율 유지

  11. 11

    Haar Cascade의 여러 이미지에서 훈련 세트 만들기

  12. 12

    SQL 데이터베이스에서 의사 결정 트리 분류기 훈련

  13. 13

    교차 검증을 수행 할 때 훈련 및 테스트 세트의 클래스 분포가 전체 세트와 동일하다는 것을 확인하면 어떤 변화가 있습니까?

  14. 14

    훈련 세트의 평균 오류가 테스트 세트의 평균 오류와 같습니까?

  15. 15

    iOS, Swift 3의 특정 뷰 컨트롤러에 대한 가로 및 세로 장치 방향 지원

  16. 16

    1 기가비트 라우터가 LAN에 미치는 영향

  17. 17

    데이터 세트에서 RandomForestClassifer의 결과를 생성, 훈련 및 인쇄하는 방법

  18. 18

    콘텐츠 신뢰를 활성화하는 Azure가 레지스트리의 기존 이미지에 영향을 미치나요?

  19. 19

    UDE를 사용한 문자 집합 감지 및 텍스트를 문자열로 가져 오기-성능에 미치는 영향

  20. 20

    R data.table에서 훈련 세트의 평균 및 표준 편차로 테스트 세트를 표준화하는 방법

  21. 21

    Azure 부하 테스트. 가상 사용자가 성능에 미치는 영향 이해

  22. 22

    별도의 데이터 프레임에서 훈련 세트와 테스트 세트를 지정하려면 어떻게해야합니까?

  23. 23

    Bigquery : 데이터 세트에있는 엄청난 양의 테이블이 성능에 영향을 미치나요?

  24. 24

    동일한 스트림에 StreamBuilder 사용 및 Firestore의 읽기 수에 미치는 영향

  25. 25

    Random Forest는 훈련 및 테스트에서 98 %의 정확도를 얻지 만 그렇지 않으면 항상 동일한 클래스를 예측합니다.

  26. 26

    대기 상태의 스레드가 Java 프로세스의 메모리에 미치는 영향

  27. 27

    Caffe, AlexNet의 사전 훈련 된 가중치를 두 개의 AlexNet이있는 사용자 지정 네트워크에 복사

  28. 28

    훈련 세트 크기와 훈련 Epoch 간의 관계

  29. 29

    limits.conf의 설정은 init.d 스크립트로 시작된 프로세스에 영향을 미치지 않습니다.

뜨겁다태그

보관