Scikit-Learn:如何检索KFold CV的预测概率?

xxxxxx

我有一个包含图像和相关描述的数据集。我将它们分为具有各自分类器(视觉和文本)的两个单独的数据集,现在我想将这两个分类器的预测结合起来以形成最终预测。

但是,我的类是二进制的1或0。我最终得到两个n_samples列表,其中填充了1和0。我假设对于大多数算法/分类器而言,这还不足以做出有用的预测(即,当一个分类器预测为1而另一个分类器预测为0时)。

因此,我认为我可以将预测的概率用作某种形式的决定性加权。SKlearn中的SVC具有此svm.SVC.predict_proba功能。返回一个看起来像这样的数组:

[[ 0.9486674   0.0513326 ]
 [ 0.97346471  0.02653529]
 [ 0.9486674   0.0513326 ]]

但是我似乎无法将其与我的Kfold交叉验证功能结合使用,cross_validation.cross_val_predict因为它本身就是一个预测函数,并且不包括类似的概率预测输出。有什么办法可以将两者结合起来吗?还是我错过了什么?

可能:我在攻击我的问题是否完全错误,是否有更好的方法来组合两个二进制分类器的预测?

提前致谢

Jianxun Li

您需要执行GridSearchCrossValidation而不只是CV。CV用于绩效评估,其本身实际上并不适合估算器。

from sklearn.datasets import make_classification
from sklearn.svm import SVC
from sklearn.grid_search import GridSearchCV

# unbalanced classification
X, y = make_classification(n_samples=1000, weights=[0.1, 0.9])

# use grid search for tuning hyperparameters
svc = SVC(class_weight='auto', probability=True)
params_space = {'kernel': ['linear', 'poly', 'rbf']}
# set cv to your K-fold cross-validation
gs = GridSearchCV(svc, params_space, n_jobs=-1, cv=5)
# fit the estimator
gs.fit(X, y)
gs.predict_proba(X)

Out[136]: 
array([[ 0.0074817 ,  0.9925183 ],
       [ 0.03655982,  0.96344018],
       [ 0.0074933 ,  0.9925067 ],
       ..., 
       [ 0.02487791,  0.97512209],
       [ 0.01426704,  0.98573296],
       [ 0.98574072,  0.01425928]])

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用decision_function_shape='ovo'从scikit-learn SVC decision_function 预测概率

来自分类Dev

如何使用 scikit learn 预测目标标签

来自分类Dev

scikit-learn的KNN如何计算概率估计?

来自分类Dev

scikit-learn:如何使用拟合概率模型?

来自分类Dev

如何获得预测概率?

来自分类Dev

如何在scikit-learn中预测时间序列?

来自分类Dev

如何使用scikit-learn评估预测的置信度得分

来自分类Dev

scikit-learn:如何缩减“ y”预测结果

来自分类Dev

scikit-learn中的StratifiedKFold vs KFold

来自分类Dev

如何使用scikit的Surprise做出预测?

来自分类Dev

Scikit-learn Ridge分类器:提取类概率

来自分类Dev

Scikit-learn Ridge分类器:提取类概率

来自分类Dev

scikit-learn - 以概率为目标变量的多项逻辑回归

来自分类Dev

使用scikit-learn预测有趣的文章

来自分类Dev

Scikit-Learn:使用DBSCAN预测新点

来自分类Dev

使用scikit-learn的Imputer模块预测缺失值

来自分类Dev

使用scikit-learn预测电影评论

来自分类Dev

GridSearchCV和预测错误分析(scikit-learn)

来自分类Dev

使用scikit-learn预测单个值会导致ValueError

来自分类Dev

使用scikit-learn预测有趣的文章

来自分类Dev

使用scikit-learn预测电影评论

来自分类Dev

从 scikit-learn 模型列表中迭代预测

来自分类Dev

如何指定scikit-learn的朴素贝叶斯的先验概率

来自分类Dev

使用Scikit-Learn的SVR,您如何结合分类和连续功能来预测目标?

来自分类Dev

如何在Python scikit-learn中从随机森林中的每棵树输出回归预测?

来自分类Dev

在使用scikit-learn测试多类svm时,如何找到预测的置信度?

来自分类Dev

scikit中的RBM预测

来自分类Dev

如何获得预测的班级而不是班级概率?

来自分类Dev

如何仅获得概率大于x的预测

Related 相关文章

  1. 1

    使用decision_function_shape='ovo'从scikit-learn SVC decision_function 预测概率

  2. 2

    如何使用 scikit learn 预测目标标签

  3. 3

    scikit-learn的KNN如何计算概率估计?

  4. 4

    scikit-learn:如何使用拟合概率模型?

  5. 5

    如何获得预测概率?

  6. 6

    如何在scikit-learn中预测时间序列?

  7. 7

    如何使用scikit-learn评估预测的置信度得分

  8. 8

    scikit-learn:如何缩减“ y”预测结果

  9. 9

    scikit-learn中的StratifiedKFold vs KFold

  10. 10

    如何使用scikit的Surprise做出预测?

  11. 11

    Scikit-learn Ridge分类器:提取类概率

  12. 12

    Scikit-learn Ridge分类器:提取类概率

  13. 13

    scikit-learn - 以概率为目标变量的多项逻辑回归

  14. 14

    使用scikit-learn预测有趣的文章

  15. 15

    Scikit-Learn:使用DBSCAN预测新点

  16. 16

    使用scikit-learn的Imputer模块预测缺失值

  17. 17

    使用scikit-learn预测电影评论

  18. 18

    GridSearchCV和预测错误分析(scikit-learn)

  19. 19

    使用scikit-learn预测单个值会导致ValueError

  20. 20

    使用scikit-learn预测有趣的文章

  21. 21

    使用scikit-learn预测电影评论

  22. 22

    从 scikit-learn 模型列表中迭代预测

  23. 23

    如何指定scikit-learn的朴素贝叶斯的先验概率

  24. 24

    使用Scikit-Learn的SVR,您如何结合分类和连续功能来预测目标?

  25. 25

    如何在Python scikit-learn中从随机森林中的每棵树输出回归预测?

  26. 26

    在使用scikit-learn测试多类svm时,如何找到预测的置信度?

  27. 27

    scikit中的RBM预测

  28. 28

    如何获得预测的班级而不是班级概率?

  29. 29

    如何仅获得概率大于x的预测

热门标签

归档