训练机器学习预测器

天鹅87

我一直在尝试使用用户数据构建预测模型。模型的输入是文档的元数据(发布日期,标题等),文档标签是用户的偏好(喜欢/不喜欢)。我想问一些我希望能得到答案的问题:

  1. 喜欢的文档比不喜欢的文档更多。我在某处读到,如果有人训练一个模型使用一个标签的输入多于另一个标签的输入,这会以一种不好的方式影响性能(模型倾向于将所有输入归类为标签/结果中的大部分
  2. 是否有可能输入ML算法,例如逻辑回归在数字和单词以及如何做到这一点上是混合的,例如:

    输入= [18,23,1,0,'cryptography'],标签= ['Like']

    我们还可以使用向量(代表单词,使用tfidf等)作为输入特征(例如50维向量)吗?

  3. 为了使用文本数据构建预测模型,唯一的方法是从文档中提到的每个单词中派生一个词典,然后构造一个二进制输入来决定是否提到一个术语?使用这样的版本,尽管我们在收藏中失去了术语的权利,对吗?我们可以在监督学习模型中将某些东西作为word2vec向量用作单个输入吗?

感谢您的时间。

尼尔·麦圭根
  1. 您需要对较大的类进行欠采样(采取较小的随机样本以匹配较小的类的大小),对较小的类进行过度采样(引导样本),或者使用支持不平衡数据的算法-为此,您可以需要阅读文档。

  2. 您需要将您的单词变成单词向量。列是语料库中所有唯一的词。行是文档。单元格值是以下各项之一:单词是否出现在文档中,出现的次数,出现的相对频率或TFIDF分数。然后,您可以将这些列与其他非单词列一起使用。

现在您的列数可能多于行数,这意味着基于矩阵的算法将具有奇异之处,在这种情况下,您需要诸如SVM或Naive Bayes之类的东西。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何使用矩阵作为 MATLAB 分类学习器的预测器?

来自分类Dev

复杂的代码和分支预测器

来自分类Dev

预测机器学习

来自分类Dev

Mykrobe预测器AMR预测不起作用

来自分类Dev

机器学习:代表训练有素的第一个数据集分类器预测第二个数据集

来自分类Dev

如何为机器学习和预测建立良好的训练数据集?

来自分类Dev

Python机器学习-训练/测试并将预测应用于新数据集

来自分类Dev

机器学习:根据训练有素的“匹配”输入向量预测输出数

来自分类Dev

如何为机器学习和预测建立良好的训练数据集?

来自分类Dev

如何使用训练有素的机器学习模型预测未标记的测试数据?

来自分类Dev

机器学习模型错误预测

来自分类Dev

2位分支预测器的状态

来自分类Dev

Pandas Statsmodels是否可以使用DF预测器进行回归预测?

来自分类Dev

在C ++中,分支预测器是否预测隐式条件语句?

来自分类Dev

重复测量:连续和分类预测器预测的连续结果

来自分类Dev

使用机器学习根据传感器数据进行故障预测

来自分类Dev

使用机器学习根据传感器数据进行故障预测

来自分类Dev

Azure机器学习为客户预测订单

来自分类Dev

Azure机器学习为客户预测订单

来自分类Dev

使用机器学习预测未来事件

来自分类Dev

机器学习模型预测错误结果

来自分类Dev

使用机器学习进行价格预测

来自分类Dev

如何在包含文本的训练集上使用机器学习分类器?

来自分类Dev

如何避免重新训练机器学习模型

来自分类Dev

Matlab机器学习训练,验证,测试分区

来自分类Dev

在生产中训练机器学习

来自分类Dev

训练机器学习算法的强度有多大?

来自分类Dev

分支预测器如何知道它是否不正确?

来自分类Dev

序列化,pyBrain中的分类,机器学习,预测

Related 相关文章

  1. 1

    如何使用矩阵作为 MATLAB 分类学习器的预测器?

  2. 2

    复杂的代码和分支预测器

  3. 3

    预测机器学习

  4. 4

    Mykrobe预测器AMR预测不起作用

  5. 5

    机器学习:代表训练有素的第一个数据集分类器预测第二个数据集

  6. 6

    如何为机器学习和预测建立良好的训练数据集?

  7. 7

    Python机器学习-训练/测试并将预测应用于新数据集

  8. 8

    机器学习:根据训练有素的“匹配”输入向量预测输出数

  9. 9

    如何为机器学习和预测建立良好的训练数据集?

  10. 10

    如何使用训练有素的机器学习模型预测未标记的测试数据?

  11. 11

    机器学习模型错误预测

  12. 12

    2位分支预测器的状态

  13. 13

    Pandas Statsmodels是否可以使用DF预测器进行回归预测?

  14. 14

    在C ++中,分支预测器是否预测隐式条件语句?

  15. 15

    重复测量:连续和分类预测器预测的连续结果

  16. 16

    使用机器学习根据传感器数据进行故障预测

  17. 17

    使用机器学习根据传感器数据进行故障预测

  18. 18

    Azure机器学习为客户预测订单

  19. 19

    Azure机器学习为客户预测订单

  20. 20

    使用机器学习预测未来事件

  21. 21

    机器学习模型预测错误结果

  22. 22

    使用机器学习进行价格预测

  23. 23

    如何在包含文本的训练集上使用机器学习分类器?

  24. 24

    如何避免重新训练机器学习模型

  25. 25

    Matlab机器学习训练,验证,测试分区

  26. 26

    在生产中训练机器学习

  27. 27

    训练机器学习算法的强度有多大?

  28. 28

    分支预测器如何知道它是否不正确?

  29. 29

    序列化,pyBrain中的分类,机器学习,预测

热门标签

归档