가지 치기가 훈련 및 테스트 세트의 정확성에 미치는 영향에 대한 이해를 높이고 싶습니다.
나의 현재 이해는 가지 치기가 나무가 과적 합되는 것을 방지하기 때문에 테스트 세트의 정확도를 향상시킬 것이라는 것입니다. 이것이 올바른 생각입니까?
그리고 가지 치기는 훈련 세트의 정확성에 어떤 영향을 미칠까요? 정확도를 떨어 뜨리는 것 같지만 그 이유는 무엇입니까?
도움을 주시면 감사하겠습니다.
트리가 훈련 세트에 대한 최적의 매개 변수 도 학습하지 않기 때문에 가지 치기는 훈련 세트의 정확도를 낮출 수 있습니다 . 그러나 적절한 매개 변수를 설정하여 과적 합을 극복하지 않으면 일반화에 실패 하는 모델을 구축하게 될 수 있습니다.
즉, 모델이 열차 데이터에서 완벽하게 예측하지만 보이지 않는 데이터로 일반화하지 못하는 지나치게 복잡한 함수를 학습했음을 의미합니다. 이는 훈련 세트가 더 낮을 때 더 문제가됩니다. 세트 자체가 미래에 올 수있는 새로운 샘플을 충분히 대표하지 못할 수 있기 때문입니다.
따라서 모델이 너무 복잡해지지 않도록 최대 깊이와 리프 수를 제한하기 위해 이러한 매개 변수를 관리해야합니다.
바이어스-분산 트레이드 오프에 대해서도 읽어 볼 수 있습니다 .
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다