我已经编写了一个简单的代码,该代码接受一个参数“ query_seq”,其他方法将计算描述符,最后可以使用“ LogisticRegression”(或该功能提供的任何其他算法)算法将预测设为“ 0(给定情况为负)”。 ”或“ 1(对于给定情况为正)”
def main_process(query_Seq):
LR = LogisticRegression()
GNB = GaussianNB()
KNB = KNeighborsClassifier()
DT = DecisionTreeClassifier()
SV = SVC(probability=True)
train_x, train_y,train_l = data_gen(p)
a = DC_CLASS()
test_x = a.main_p(query_Seq)
return Prediction(train_x, train_y, test_x,LR)
在执行交叉验证时,我们已经为算法的准确性估计计算了不同的统计参数(特异性,灵敏度,mmc等)。现在我的问题是,scikit-learn中是否有任何方法可以用来估计测试数据预测的置信度得分。
许多分类器可以通过调用方法predict_proba
代替predict
方法来提示您自己对给定预测的置信度。阅读此方法的文档字符串,以了解其返回的numpy数组的内容。
但是请注意,分类器在估计自己的置信度时也会出错。要解决此问题,您可以使用外部校准程序通过保留的数据(使用交叉验证循环)来校准分类器。该文档将为您提供有关校准的更多详细信息:
http://scikit-learn.org/stable/modules/calibration.html
最后请注意,LogisticRegression
默认情况下,它给出了经过良好校准的置信度。其他大多数模型类别都可以从外部校准中受益。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句