使用scikit-learn预测电影评论

阿纳努克

我正在使用scikit-learn MultinomialNB和Vectorizer建立预测该评价好坏的预测模型。

在对标签数据进行训练之后,如何使用它来预测新评论(或现有评论)?我收到以下错误消息。

from sklearn.feature_extraction.text import CountVectorizer
from sklearn.cross_validation import train_test_split
from sklearn.naive_bayes import MultinomialNB

X = vectorizer.fit_transform(df.quote)
X = X.tocsc()
Y = (df.fresh == 'fresh').values.astype(np.int)

xtrain, xtest, ytrain, ytest = train_test_split(X, Y)

clf = MultinomialNB().fit(xtrain, ytrain)

new_review = ['this is a new review, movie was awesome']
new_review = vectorizer.fit_transform(new_review)

print df.quote[15]
print(clf.predict(df.quote[10])) #predict existing review in dataframe
print(clf.predict(new_review)) #predict new review


Technically, Toy Story is nearly flawless.
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-91-27a0698bbd1f> in <module>()
     15 
     16 print df.quote[15]
---> 17 print(clf.predict(df.quote[10])) #predict existing quote in dataframe
     18 print(clf.predict(new_review)) #predict new review

//anaconda/lib/python2.7/site-packages/sklearn/naive_bayes.pyc in predict(self, X)
     60             Predicted target values for X
     61         """
---> 62         jll = self._joint_log_likelihood(X)
     63         return self.classes_[np.argmax(jll, axis=1)]
     64 

//anaconda/lib/python2.7/site-packages/sklearn/naive_bayes.pyc in _joint_log_likelihood(self, X)
    439         """Calculate the posterior log probability of the samples X"""
    440         X = atleast2d_or_csr(X)
--> 441         return (safe_sparse_dot(X, self.feature_log_prob_.T)
    442                 + self.class_log_prior_)
    443 

//anaconda/lib/python2.7/site-packages/sklearn/utils/extmath.pyc in safe_sparse_dot(a, b, dense_output)
    178         return ret
    179     else:
--> 180         return fast_dot(a, b)
    181 
    182 

TypeError: Cannot cast array data from dtype('float64') to dtype('S32') according to the rule 'safe'
裂解酶

您需要将“单词袋”表示形式predict直接传递给文本而不是直接传递文本。您几乎可以正确地执行此操作new_review,只是进行更改new_review = vectorizer.transform(new_review)(请参阅@Stergios评论)。试试这个:

print(clf.predict(X[10, :]))

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用scikit-learn预测电影评论

来自分类Dev

使用Rapidminer对imdb电影评论进行文本分析

来自分类Dev

如何使用 scikit learn 预测目标标签

来自分类Dev

斯坦福大学NLP解析器针对Kaggle电影评论中使用的同一条语句给出了不同的结果(情感)

来自分类Dev

斯坦福大学NLP解析器针对Kaggle电影评论中使用的同一条语句给出了不同的结果(情感)

来自分类Dev

电影评论类别错误 - NTLK

来自分类Dev

使用scikit-learn预测有趣的文章

来自分类Dev

如何使用scikit-learn评估预测的置信度得分

来自分类Dev

Scikit-Learn:使用DBSCAN预测新点

来自分类Dev

使用scikit-learn的Imputer模块预测缺失值

来自分类Dev

使用scikit-learn预测单个值会导致ValueError

来自分类Dev

使用scikit-learn预测有趣的文章

来自分类Dev

如何使用scikit的Surprise做出预测?

来自分类Dev

使用 Scikit-Learn with Python 将评论分为正面和负面

来自分类Dev

使用scikit-learn训练多维数据

来自分类Dev

使用scikit-learn让熊猫玩得开心

来自分类Dev

使用Scikit Learn进行Unigram分析

来自分类Dev

使用scikit-learn处理分类特征

来自分类Dev

使用scikit-learn处理分类特征

来自分类Dev

使用 Anaconda 更新 scikit-learn 失败

来自分类Dev

使用scikit-learn可以预测给定“ y”的数据向量“ x”?

来自分类Dev

使用Scikit-Learn的SVR,您如何结合分类和连续功能来预测目标?

来自分类Dev

有什么办法可以在Python中使用scikit-learn来预测每月的时间序列?

来自分类Dev

使用scikit-learn可以在给定“ y”的情况下预测数据向量“ x”?

来自分类Dev

在使用scikit-learn测试多类svm时,如何找到预测的置信度?

来自分类Dev

使用decision_function_shape='ovo'从scikit-learn SVC decision_function 预测概率

来自分类Dev

使用Scikit-Learn使用Momentum进行反向传播

来自分类Dev

使用 Scikit-Learn 使用分类数据制作回归模型

来自分类Dev

使用scikit确定每个功能对特定类别预测的贡献

Related 相关文章

  1. 1

    使用scikit-learn预测电影评论

  2. 2

    使用Rapidminer对imdb电影评论进行文本分析

  3. 3

    如何使用 scikit learn 预测目标标签

  4. 4

    斯坦福大学NLP解析器针对Kaggle电影评论中使用的同一条语句给出了不同的结果(情感)

  5. 5

    斯坦福大学NLP解析器针对Kaggle电影评论中使用的同一条语句给出了不同的结果(情感)

  6. 6

    电影评论类别错误 - NTLK

  7. 7

    使用scikit-learn预测有趣的文章

  8. 8

    如何使用scikit-learn评估预测的置信度得分

  9. 9

    Scikit-Learn:使用DBSCAN预测新点

  10. 10

    使用scikit-learn的Imputer模块预测缺失值

  11. 11

    使用scikit-learn预测单个值会导致ValueError

  12. 12

    使用scikit-learn预测有趣的文章

  13. 13

    如何使用scikit的Surprise做出预测?

  14. 14

    使用 Scikit-Learn with Python 将评论分为正面和负面

  15. 15

    使用scikit-learn训练多维数据

  16. 16

    使用scikit-learn让熊猫玩得开心

  17. 17

    使用Scikit Learn进行Unigram分析

  18. 18

    使用scikit-learn处理分类特征

  19. 19

    使用scikit-learn处理分类特征

  20. 20

    使用 Anaconda 更新 scikit-learn 失败

  21. 21

    使用scikit-learn可以预测给定“ y”的数据向量“ x”?

  22. 22

    使用Scikit-Learn的SVR,您如何结合分类和连续功能来预测目标?

  23. 23

    有什么办法可以在Python中使用scikit-learn来预测每月的时间序列?

  24. 24

    使用scikit-learn可以在给定“ y”的情况下预测数据向量“ x”?

  25. 25

    在使用scikit-learn测试多类svm时,如何找到预测的置信度?

  26. 26

    使用decision_function_shape='ovo'从scikit-learn SVC decision_function 预测概率

  27. 27

    使用Scikit-Learn使用Momentum进行反向传播

  28. 28

    使用 Scikit-Learn 使用分类数据制作回归模型

  29. 29

    使用scikit确定每个功能对特定类别预测的贡献

热门标签

归档