使用SVM进行分类

棘皮炎

为了对文本进行分类,我想使用SVM。我想将测试数据分类为标签之一(健康/成人)培训和测试数据是文本文件

我正在使用python的scikit库。当我将文本保存到txt文件时,我对其进行utf-8编码,这就是为什么我要在代码段中对其进行解码。这是我尝试的代码

String = String.decode('utf-8')
String2 = String2.decode('utf-8')
bigram_vectorizer = CountVectorizer(ngram_range=(1, 2),
                                     token_pattern=r'\b\w+\b', min_df=1)

X_2 = bigram_vectorizer.fit_transform(String2).toarray()
X_1 = bigram_vectorizer.fit_transform(String).toarray()
X_train = np.array([X_1,X_2])
print type(X_train)
y = np.array([1, 2])
clf = SVC()
clf.fit(X_train, y)

#prepare test data
print(clf.predict(X))

这是我得到的错误

  File "/Users/guru/python_projects/implement_LDA/lda/apply.py", line 107, in <module>
    clf.fit(X_train, y)
  File "/Users/guru/python_projects/implement_LDA/lda/lib/python2.7/site-packages/sklearn/svm/base.py", line 150, in fit
    X = check_array(X, accept_sparse='csr', dtype=np.float64, order='C')
  File "/Users/guru/python_projects/implement_LDA/lda/lib/python2.7/site-packages/sklearn/utils/validation.py", line 373, in check_array
    array = np.array(array, dtype=dtype, order=order, copy=copy)
ValueError: setting an array element with a sequence.

当我搜索错误时,我发现了一些结果,但它们甚至都没有帮助。在应用SVM模型时,我认为这在逻辑上是错误的。有人可以给我一个提示吗?

参考:[1] [2]

最后期限

您必须合并样本,将其向量化,然后拟合分类器。像这样:

String = String.decode('utf-8')
String2 = String2.decode('utf-8')
bigram_vectorizer = CountVectorizer(ngram_range=(1, 2),
                                     token_pattern=r'\b\w+\b', min_df=1)

X_train = bigram_vectorizer.fit_transform(np.array([String, String2]))
print type(X_train)
y = np.array([1, 2])
clf = SVC()
clf.fit(X_train, y)

#prepare test data
print(clf.predict(bigram_vectorizer.transform(np.array([X1, X2, ...]))))

但是2个样本的数据量很少,因此您的预测可能不准确。

编辑:

您也可以使用管道在一个步骤中组合转换和分类。

from sklearn.pipeline import Pipeline

print type(X_train) # Should be a list of texts length 100 in your case
y_train = ... # Should be also a list of length 100
clf = Pipeline([
    ('transformer', CountVectorizer(...)),
    ('estimator', SVC()),
])
clf.fit(X_train, y_train)

X_test = np.array(["sometext"]) # array of test texts length = 1
print(clf.predict(X_test))

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用SVM和BOW进行图像分类?

来自分类Dev

使用R中的SVM进行一类分类

来自分类Dev

使用要点和SVM训练进行图像分类

来自分类Dev

使用R和SVM进行文本分类。矩阵功能

来自分类Dev

Scikit学习-如何使用SVM和随机森林进行文本分类?

来自分类Dev

使用预制字典进行文本分类的SVM特征向量表示

来自分类Dev

使用具有单个功能的径向基内核SVM进行二进制分类

来自分类Dev

在Java代码中使用哪些Weka和LibSVM .jar文件进行SVM分类

来自分类Dev

使用预制字典进行文本分类的SVM特征向量表示

来自分类Dev

使用OpenCV在多类别分类中获得SVM分类分数

来自分类Dev

使用NNET进行分类

来自分类Dev

tensorflow tf.contrib.learn.SVM 如何重新加载训练好的模型并使用预测对新数据进行分类

来自分类Dev

如何在Python中进行PCA和SVM分类

来自分类Dev

测试SVM分类器以进行文本分类时出错

来自分类Dev

使用gbm()进行分类-错误

来自分类Dev

如何使用SIFT和SVM实现常规图像分类器

来自分类Dev

如何使用Sk-learn提高SVM分类器的速度

来自分类Dev

如何使用python多次训练SVM分类器?

来自分类Dev

使用条件进行分组并对python进行分类

来自分类Dev

了解线性分类SVM

来自分类Dev

我可以使用 PCA 进行降维,然后将其 o/p 用于 Python 中的一类 SVM 分类器吗

来自分类Dev

使用级联分类器使用Kinect进行对象分类

来自分类Dev

使用OpenCV SVM进行对象检测

来自分类Dev

使用opencv SVM进行火车火灾检测

来自分类Dev

使用图像训练 SVM 并进行预测

来自分类Dev

如何使用保存 SVM 模型进行预测

来自分类Dev

使用分类数据进行回归时发现未知分类

来自分类Dev

R:使用knncat对分类变量进行分类时出错

来自分类Dev

如何标记PCA获得的用于训练SVM的训练预测进行分类?的MATLAB

Related 相关文章

  1. 1

    使用SVM和BOW进行图像分类?

  2. 2

    使用R中的SVM进行一类分类

  3. 3

    使用要点和SVM训练进行图像分类

  4. 4

    使用R和SVM进行文本分类。矩阵功能

  5. 5

    Scikit学习-如何使用SVM和随机森林进行文本分类?

  6. 6

    使用预制字典进行文本分类的SVM特征向量表示

  7. 7

    使用具有单个功能的径向基内核SVM进行二进制分类

  8. 8

    在Java代码中使用哪些Weka和LibSVM .jar文件进行SVM分类

  9. 9

    使用预制字典进行文本分类的SVM特征向量表示

  10. 10

    使用OpenCV在多类别分类中获得SVM分类分数

  11. 11

    使用NNET进行分类

  12. 12

    tensorflow tf.contrib.learn.SVM 如何重新加载训练好的模型并使用预测对新数据进行分类

  13. 13

    如何在Python中进行PCA和SVM分类

  14. 14

    测试SVM分类器以进行文本分类时出错

  15. 15

    使用gbm()进行分类-错误

  16. 16

    如何使用SIFT和SVM实现常规图像分类器

  17. 17

    如何使用Sk-learn提高SVM分类器的速度

  18. 18

    如何使用python多次训练SVM分类器?

  19. 19

    使用条件进行分组并对python进行分类

  20. 20

    了解线性分类SVM

  21. 21

    我可以使用 PCA 进行降维,然后将其 o/p 用于 Python 中的一类 SVM 分类器吗

  22. 22

    使用级联分类器使用Kinect进行对象分类

  23. 23

    使用OpenCV SVM进行对象检测

  24. 24

    使用opencv SVM进行火车火灾检测

  25. 25

    使用图像训练 SVM 并进行预测

  26. 26

    如何使用保存 SVM 模型进行预测

  27. 27

    使用分类数据进行回归时发现未知分类

  28. 28

    R:使用knncat对分类变量进行分类时出错

  29. 29

    如何标记PCA获得的用于训练SVM的训练预测进行分类?的MATLAB

热门标签

归档