랜덤 포레스트 정확도 향상

debugcn 에 게시 Dev

Abanoub rafaat

객체 감지를 위해 RandomForestClassifier 메서드를 사용하고 있습니다. 문제는 내 임의 상태가 기본값으로 0이어야한다는 것을 알고 있어도 정확도가 매우 나빠서 어쨌든 내 n_estimators, random_state 매개 변수에 대한 최상의 값이 무엇인지 알 수 있습니까?

from sklearn.ensemble import RandomForestClassifier
RF_model = RandomForestClassifier(n_estimators = 250, random_state = 120)

갈렌

모델에 가장 적합한 매개 변수를 결정하기 위해 그리드 검색이라는 프로세스를 사용할 수 있습니다. Sklearn은이를 수행하기위한 클래스를 제공합니다 GridSearchCV. Random Forest 분류기에 사용하는 방법에 대한 코드 샘플을 제공했습니다.

from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import GridSearchCV

# provide iterables of values to be tested each parameter
parameters = {'n_estimators': [100, 250, 500, 750]}
clf = GridSearchCV(RandomForestClassifier(), parameters)
clf.fit(X, y)  # X and y are your training data and targets

귀하의 질문에서 n_estimators및 random_state매개 변수에 대한 최상의 값을 구체적으로 찾고 있다고 언급 한 점은 주목할 가치가 있습니다. random_state이 매개 변수는 일반적으로 결과의 재현성을 위해 존재하므로 GridSearch의 일부로 포함하지 않았습니다 . 여기 에 해당 매개 변수에 대한 Sklearns Glossary의 추가 자료가 있습니다.

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-5

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

랜덤 포레스트 정확도 향상

랜덤 포레스트 정확도 향상

이항 반응에 대한 랜덤 포레스트 변수 중요도 및 상관 방향

맥북에서 랜덤 포레스트의 병렬 실행으로 작은 속도 향상 (R, 캐럿 사용)

셔플 훈련 데이터가 랜덤 포레스트 분류기의 정확도에 영향을 미치는 이유는 무엇입니까?

다 정밀도 랜덤 생성기 시드 오류 향상

R 캐럿 랜덤 포레스트 ggplot 범례 수정

Tensorflow로 테스트 정확도 향상

이상치 탐지에서 격리 포레스트 vs 강력한 랜덤 컷 포레스트

OpenCV 던지는 오류. 랜덤 포레스트 모델 사용 시도

랜덤 포레스트 예측 값

sklearn의 랜덤 포레스트

OnevsrestClassifier 및 랜덤 포레스트

랜덤 포레스트 변수 선택

랜덤 포레스트에서 동일한 예측 (확률 및 클래스)을 얻는 방법

랜덤 포레스트로 배깅, MASS : Boston 데이터 세트로도 개체를 찾을 수 없음

랜덤 포레스트에서 의사 결정 트리의 가치를 얻습니다.

랜덤 포레스트의 훈련 속도를 어떻게 높일 수 있습니까?

첨도가 3보다 큰 랜덤 정규 분포 생성

회귀 랜덤 포레스트에서 확률 밀도 함수를 얻으려면 어떻게해야합니까?

Tidymodel 패키지 : R의 일반 선형 모델 (glm) 및 의사 결정 트리 (배깅 트리, 부스트 트리 및 랜덤 포레스트) 모델

랜덤 포레스트 부트 스트랩 훈련 및 포레스트 생성

내포 된 랜덤 효과 및 랜덤 효과 간의 상호 작용이있는 분할 플롯 디자인

C ++ 11 랜덤 엔진 및 분포 상호 작용 및 비용

R의 다중 래스터 랜덤 포레스트

특정 상관 임계 값으로 랜덤 변수 생성

Pytesseract, OCR 정확도 향상

확률 분포에서 랜덤 변수 생성

랜덤 오브젝트의 시드를 랜덤 값으로 설정하면 생성기가 더 랜덤하게 만들어 집니까?

랜덤 오브젝트의 시드를 랜덤 값으로 설정하면 생성기가 더 랜덤하게 만들어 집니까?

트리가 하나 인 랜덤 포레스트는 단일 의사 결정 트리보다 성능이 더 나쁩니 까?