Scikit学习-如何使用SVM和随机森林进行文本分类？

Crista23 发表于 Dev

Crista23

我有一组，trainFeatures一组testFeatures带有正，中性和负标签：

trainFeats = negFeats + posFeats + neutralFeats
testFeats  = negFeats + posFeats + neutralFeats

例如，内部的一个条目trainFeats是

(['blue', 'yellow', 'green'], 'POSITIVE')

测试功能列表也是如此，因此我为每组指定标签。我的问题是如何使用随机森林分类器和SVM的scikit实现来获得该分类器的准确性以及每个类别的准确性和召回率得分？问题是我目前使用单词作为特征，而根据我的阅读，这些分类器需要数字。有没有一种方法可以实现我的目标而无需更改功能？非常感谢！

dnll

您可以查看此scikit-learn教程，尤其是有关如何创建和使用分类器的学习和预测部分。该示例使用SVM，但是，使用RandomForestClassifier代替它是简单的，因为所有分类器都实现fit和predict方法。

使用文本功能时，可以使用CountVectorizer或DictVectorizer。看一下特征提取，尤其是第4.1.3节。

您可以在此处找到分类文本文档的示例。

然后，您可以通过分类报告获得分类器的精度和召回率。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-7

我来说两句

0条评论

登录后参与评论

来自分类Dev

scikit学习随机森林的输入

来自分类Dev

Scikit使用随机森林学习分类数据

来自分类Dev

Scikit学习分类

来自分类Dev

scikit中的弱学习者学习随机森林和多余的树分类器

来自分类Dev

ValueError：scikit的随机森林分类学习

来自分类Dev

结合scikit学习中的随机森林模型

来自分类Dev

Scikit学习SVM数字识别

来自分类Dev

scikit中的分类报告学习

来自分类Dev

对于使用 scikit-learn 进行文本分类，我是否必须同时使用 Countvectorizer 和 TFIDF？

来自分类Dev

scikit学习文本的多标签分类

来自分类Dev

Python - 使用 scikit 学习随机森林关于值格式的错误

来自分类Dev

scikit学习对停用词进行分类

来自分类Dev

如何为随机森林分类器，Ada Boost分类器，Extra Trees分类器访问python scikit学习代码

来自分类Dev

scikit学习离散分类数值数据

来自分类Dev

Scikit学习：并行化随机梯度下降

来自分类Dev

如何使用SciKit随机森林的oob_decision_function_学习曲线？

来自分类Dev

Scikit学习随机森林拟合方法中的值误差

来自分类Dev

Sage 7.2中的Scikit学习和熊猫

来自分类Dev

使用scikit使用余弦距离学习KNeighborsClassifier

来自分类Dev

如何评估scikit学习LogisticRegression的成本函数？

来自分类Dev

如何创建scikit学习数据集？

来自分类Dev

约束线性回归-scikit如何学习？

来自分类Dev

使用Scikit学习Google App引擎

来自分类Dev

转换JPG图像以输入到scikit学习SVM分类器

来自分类Dev

转换JPG图像以输入到scikit学习SVM分类器

来自分类Dev

python：如何在scikit学习分类器（SVM）等中使用POS（词性）功能

来自分类Dev

python：如何在scikit学习分类器（SVM）等中使用POS（词性）功能

来自分类Dev

在scikit中最终期望相同的预期和预测数组学习随机森林模型

来自分类Dev

在Scikit学习分类器上使用交叉验证

Related 相关文章

文章