Sklearn:如何为MultinomialNB添加关联规则以进行文本分类?

安全坦顿

问题To classify the user product as banned or approved

如果产品中包含“濒危物种”,“虎皮”等禁止字词,则会被标记为“禁止字样。

  • 输入:标题+产品说明
  • 对应标签:批准/禁止

我使用监督学习算法MultinomialNB对产品进行分类,使用bigrams可以达到92%的精度。

但是我有一个错误分类的问题,即“虎皮”产品正在获得批准。原因是我们有很多“虎皮花岗石/虎皮虾”的产品被标记为已批准。

为了解决此问题,我想与MultinomialNB算法一起创建一些规则,以改善这些错误分类。

规则应如下所示:-如果关键字“ tiger”在附近的3/4字词上也有花岗岩/大虾,然后将其标记/视为已批准。

请在这里帮助我。我怎样才能做到这一点。

马克西姆

您可能想尝试的一件事是使用另一种分类器,例如GradientBoostedClassifier,它可以捕获变量之间的交互。这可能会解决您的问题。否则,您可以只使用正则表达式来实现您的自定义规则:

import re
if re.search(tiger (\w+ ){0,4}(prawn|granite),text):
   return 'allowed'

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何使用Accord.Net进行文本分类?

来自分类Dev

如何使用GPT 3进行文本分类?

来自分类Dev

使用 Python 进行文本分类

来自分类Dev

使用 Keras 进行文本分类

来自分类Dev

Weka进行文本分类器:如何正确训练分类器问题

来自分类Dev

如何使用sklearn库使用朴素贝叶斯执行文本分类?

来自分类Dev

Scikit学习-如何使用SVM和随机森林进行文本分类?

来自分类Dev

如何从tsv文件创建序列文件以进行文本分类

来自分类Dev

使用Spark ML进行文本分类

来自分类Dev

使用朴素贝叶斯进行文本分类

来自分类Dev

编码数据标签以进行文本分类

来自分类Dev

测试SVM分类器以进行文本分类时出错

来自分类Dev

如何在Spark中进行文本分析

来自分类Dev

使用R和SVM进行文本分类。矩阵功能

来自分类Dev

一对一匹配标签以进行文本分类

来自分类Dev

使用预制字典进行文本分类的SVM特征向量表示

来自分类Dev

使用TF-IDF分数进行文本分类的KNN

来自分类Dev

使用Keras在LSTM中获取单词进行文本分类的可能性

来自分类Dev

使用预制字典进行文本分类的SVM特征向量表示

来自分类Dev

使用我自己的数据进行文本分类的Tensorflow错误

来自分类Dev

scikit-learn中安排文本数据进行文本分类的标准方法是什么?

来自分类Dev

对于使用 scikit-learn 进行文本分类,我是否必须同时使用 Countvectorizer 和 TFIDF?

来自分类Dev

如何计算文本分类的困惑度?

来自分类Dev

如何将包含多个“文档”的XML文件读入R进行文本分析?

来自分类Dev

如何处理以下文本文件以进行文本分类?我希望每个段落都作为熊猫数据框中的一行,但我无法做到这一点

来自分类Dev

文本分类 NaiveBayes

来自分类Dev

文本分类问题

来自分类Dev

使用TensorFlow进行多标签文本分类

来自分类Dev

文本分类是否足够快以进行提前输入搜索?

Related 相关文章

  1. 1

    如何使用Accord.Net进行文本分类?

  2. 2

    如何使用GPT 3进行文本分类?

  3. 3

    使用 Python 进行文本分类

  4. 4

    使用 Keras 进行文本分类

  5. 5

    Weka进行文本分类器:如何正确训练分类器问题

  6. 6

    如何使用sklearn库使用朴素贝叶斯执行文本分类?

  7. 7

    Scikit学习-如何使用SVM和随机森林进行文本分类?

  8. 8

    如何从tsv文件创建序列文件以进行文本分类

  9. 9

    使用Spark ML进行文本分类

  10. 10

    使用朴素贝叶斯进行文本分类

  11. 11

    编码数据标签以进行文本分类

  12. 12

    测试SVM分类器以进行文本分类时出错

  13. 13

    如何在Spark中进行文本分析

  14. 14

    使用R和SVM进行文本分类。矩阵功能

  15. 15

    一对一匹配标签以进行文本分类

  16. 16

    使用预制字典进行文本分类的SVM特征向量表示

  17. 17

    使用TF-IDF分数进行文本分类的KNN

  18. 18

    使用Keras在LSTM中获取单词进行文本分类的可能性

  19. 19

    使用预制字典进行文本分类的SVM特征向量表示

  20. 20

    使用我自己的数据进行文本分类的Tensorflow错误

  21. 21

    scikit-learn中安排文本数据进行文本分类的标准方法是什么?

  22. 22

    对于使用 scikit-learn 进行文本分类,我是否必须同时使用 Countvectorizer 和 TFIDF?

  23. 23

    如何计算文本分类的困惑度?

  24. 24

    如何将包含多个“文档”的XML文件读入R进行文本分析?

  25. 25

    如何处理以下文本文件以进行文本分类?我希望每个段落都作为熊猫数据框中的一行,但我无法做到这一点

  26. 26

    文本分类 NaiveBayes

  27. 27

    文本分类问题

  28. 28

    使用TensorFlow进行多标签文本分类

  29. 29

    文本分类是否足够快以进行提前输入搜索?

热门标签

归档