객체 감지를 위해 RandomForestClassifier 메서드를 사용하고 있습니다. 문제는 내 임의 상태가 기본값으로 0이어야한다는 것을 알고 있어도 정확도가 매우 나빠서 어쨌든 내 n_estimators, random_state 매개 변수에 대한 최상의 값이 무엇인지 알 수 있습니까?
from sklearn.ensemble import RandomForestClassifier
RF_model = RandomForestClassifier(n_estimators = 250, random_state = 120)
모델에 가장 적합한 매개 변수를 결정하기 위해 그리드 검색이라는 프로세스를 사용할 수 있습니다. Sklearn은이를 수행하기위한 클래스를 제공합니다 GridSearchCV
. Random Forest 분류기에 사용하는 방법에 대한 코드 샘플을 제공했습니다.
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import GridSearchCV
# provide iterables of values to be tested each parameter
parameters = {'n_estimators': [100, 250, 500, 750]}
clf = GridSearchCV(RandomForestClassifier(), parameters)
clf.fit(X, y) # X and y are your training data and targets
귀하의 질문에서 n_estimators
및 random_state
매개 변수에 대한 최상의 값을 구체적으로 찾고 있다고 언급 한 점은 주목할 가치가 있습니다. random_state
이 매개 변수는 일반적으로 결과의 재현성을 위해 존재하므로 GridSearch의 일부로 포함하지 않았습니다 . 여기 에 해당 매개 변수에 대한 Sklearns Glossary의 추가 자료가 있습니다.
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다