SSAS-分类-如何将数据划分为:训练集-验证集-测试集

BI Dude

我有一组300,000条历史客户购买数据记录。我已经开始进行SSAS数据挖掘项目,以确定最佳客户。

数据划分:-90%非买家-10%买家

我使用了SSAS的各种算法(决策树和神经网络表现出最好的提升)来探索我的数据。

该项目的目标是根据谁最有可能购买产品来识别/打分。

目前,我已将所有记录用于此目的。感觉项目中缺少一些东西。我正在阅读两本有关数据挖掘的书。他们两个都讨论将数据挖掘分为不同的集合。但是,它们都没有解释如何实际拆分它们。

我相信我需要将可能的记录分成3组,然后重新运行ssas算法。

主要问题:

  1. 如何将数据分为培训,验证和测试集1.1培训集中应有多少比例的购买者和非购买者?
  2. 如何根据最有可能购买产品和最有可能购买产品的方式对客户进行评分。
Pabaldonedo

您可以对数据集进行随机划分,因为您的数据集很大并且购买者的数量也不太低(10%)。但是,如果您要确保自己的数据集具有代表性,则可以抽取80%的买方样本和80%的非买方样本,然后将它们混合以构建包含总数据集80%且具有购买者与非购买者的比例与原始数据集相同,从而使子集具有代表性。您可能希望将数据集不分为两个子集,而是分为三个子集:训练,交叉验证和测试。如果使用neural network您所说的,则应使用交叉验证子集来调整模型(权重衰减,学习率,动量...)。

关于您的第二个问题,您可以使用您所说的神经网络并获取输出,如果在输出层中使用S型曲线作为激活函数,则该输出将在[0,1]范围内,作为概率。我还建议您看一下collaborative filtering此任务,因为它可以帮助您了解哪些产品可能是对使用其他具有相似偏好的其他买家的知识感兴趣的客户。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

SSAS-分类-如何将数据划分为:训练集-验证集-测试集

来自分类Dev

如何将数据集划分为类之间的训练和验证集保持率?

来自分类Dev

如何将数据集划分为 R 中所有可能的测试和训练组合?

来自分类Dev

当数据为每组行而不是每组一行时,如何将数据集拆分/划分为训练集和测试集

来自分类Dev

Excel - 如何将数据拆分为平均分布的训练集和测试集

来自分类Dev

如何训练大型数据集进行分类

来自分类Dev

使用runif将数据集分为训练和测试集

来自分类Dev

预处理图像数据集,包括划分为训练集和测试集

来自分类Dev

SSAS多维数据集建模

来自分类Dev

面部表情数据集的训练验证测试集拆分

来自分类Dev

如何在TensorFlow中使用我自己的数据将图像分为测试集和训练集

来自分类Dev

如何删除 SSAS 多维数据集?

来自分类Dev

使用P-splines拟合数据时,是否需要将数据集划分为验证集和测试集?

来自分类Dev

使用张量流将数据集分为训练和测试

来自分类Dev

按月将数据集拆分为训练和测试

来自分类Dev

在Postgres中将数据集分为训练和测试集

来自分类Dev

将Hive表拆分为测试集和训练集?

来自分类Dev

在Matlab中使用经过交叉验证的Knn分类器模型为新数据集(测试数据)预测标签

来自分类Dev

SSAS多维数据集细分,相关数据

来自分类Dev

使用PyTorch将Traininng数据集分为CIFAR10的训练和验证集后,如何增加数据?

来自分类Dev

如何使用scikit crossvalidation模块将数据(原始文本)拆分为测试/训练集?

来自分类Dev

按时间索引时将熊猫数据框分为训练集和测试集

来自分类Dev

按时间索引时,将熊猫数据框分为训练集和测试集

来自分类Dev

用于验证测试的Json Schema数据集

来自分类Dev

在Tensorflow中读取大型训练/验证/测试数据集

来自分类Dev

在Tensorflow中读取大型训练/验证/测试数据集

来自分类Dev

如何将训练数据集上的线性回归结果应用于测试数据集?

来自分类Dev

如何将训练数据集上的线性回归结果应用到测试数据集上?

来自分类Dev

类型错误:级别类型不匹配:0.2。将数据拆分为训练、验证和测试集时

Related 相关文章

  1. 1

    SSAS-分类-如何将数据划分为:训练集-验证集-测试集

  2. 2

    如何将数据集划分为类之间的训练和验证集保持率?

  3. 3

    如何将数据集划分为 R 中所有可能的测试和训练组合?

  4. 4

    当数据为每组行而不是每组一行时,如何将数据集拆分/划分为训练集和测试集

  5. 5

    Excel - 如何将数据拆分为平均分布的训练集和测试集

  6. 6

    如何训练大型数据集进行分类

  7. 7

    使用runif将数据集分为训练和测试集

  8. 8

    预处理图像数据集,包括划分为训练集和测试集

  9. 9

    SSAS多维数据集建模

  10. 10

    面部表情数据集的训练验证测试集拆分

  11. 11

    如何在TensorFlow中使用我自己的数据将图像分为测试集和训练集

  12. 12

    如何删除 SSAS 多维数据集?

  13. 13

    使用P-splines拟合数据时,是否需要将数据集划分为验证集和测试集?

  14. 14

    使用张量流将数据集分为训练和测试

  15. 15

    按月将数据集拆分为训练和测试

  16. 16

    在Postgres中将数据集分为训练和测试集

  17. 17

    将Hive表拆分为测试集和训练集?

  18. 18

    在Matlab中使用经过交叉验证的Knn分类器模型为新数据集(测试数据)预测标签

  19. 19

    SSAS多维数据集细分,相关数据

  20. 20

    使用PyTorch将Traininng数据集分为CIFAR10的训练和验证集后,如何增加数据?

  21. 21

    如何使用scikit crossvalidation模块将数据(原始文本)拆分为测试/训练集?

  22. 22

    按时间索引时将熊猫数据框分为训练集和测试集

  23. 23

    按时间索引时,将熊猫数据框分为训练集和测试集

  24. 24

    用于验证测试的Json Schema数据集

  25. 25

    在Tensorflow中读取大型训练/验证/测试数据集

  26. 26

    在Tensorflow中读取大型训练/验证/测试数据集

  27. 27

    如何将训练数据集上的线性回归结果应用于测试数据集?

  28. 28

    如何将训练数据集上的线性回归结果应用到测试数据集上?

  29. 29

    类型错误:级别类型不匹配:0.2。将数据拆分为训练、验证和测试集时

热门标签

归档