Apriori算法-频繁项目集生成

用户名

我正在使用Apriori算法来识别客户的频繁项目集。基于已识别的频繁项目集,当客户将新项目添加到购物清单时,我想向客户提示建议项目,作为频繁项目集,我得到了结果如下;

[1],[3],[2],[5]
[2.3],[3,5],[1,3],[2,5]
[2,3,5]

我的问题是,如果我仅考虑设置[2,3,5]来向客户提出建议,那我错了吗?例如,如果客户将项目3添加到他的购物清单中,我会推荐项目2和项目5。如果客户将项目1添加到购物清单中,则不会提出任何建议,因为我考虑的是仅设置[2,3,5]而项目1是在该集合中不可用。我想知道我的逻辑(仅考虑集合[2,3,5])是否足以为用户提供建议

有QUIT--Anony-Mousse

否。推导推荐规则需要更多的努力。

仅仅因为[2,3,5]频繁并不能意味着2 - > 3,5是一个很好的规则。

考虑一下2是非常受欢迎的产品,但3,5只是很少出现的情况。考虑加油站。[天然气,咖啡,百吉饼]可能是经常使用的商品,但是购买天然气的顾客很少,他们也会购买咖啡和百吉饼(低置信度)。

确实要考虑诸如2,3-> 5之类的规则,因为它们可能具有更高的置信度即,如果客户购买汽油和咖啡,则建议面包圈。

频率不足以推荐!考虑在80%的情况下购买了2和3。2、3、5在60%的情况下被购买。天真的,在8次中有6次,客户还将购买5次,这是正确率的75%!但这并不意味着5是一个很好的建议!因为5占总数的80%,所以如果他购买2和3,则实际上购买5的可能性要小5%,而我们在这里有负相关。这就是为什么您也需要研究一下举升机的原因或类似的其他措施,有很多。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

生成Apriori算法的候选项目集

来自分类Dev

Weka Apriori算法转换数据集

来自分类Dev

Apriori算法使用R生成所有规则

来自分类Dev

无法使用 Apriori 算法生成规则列表

来自分类Dev

对于大数据集,如何在 R 中使用 apriori 算法?

来自分类Dev

如何在R中使用apriori找到频繁项集?

来自分类Dev

Apriori算法中的词典顺序

来自分类Dev

使用Apriori算法无输出

来自分类Dev

Apriori算法运行时间

来自分类Dev

在Weka中使用Apriori算法获取频率

来自分类Dev

如何在H2O中实现Apriori算法?

来自分类Dev

生成功率集算法?

来自分类Dev

生成所有多集size-n分区的算法

来自分类Dev

生成所有多集size-n分区的算法

来自分类Dev

什么是频繁使用最快的levenshtein算法

来自分类Dev

Python:优化函数以找到给定候选项目集的大小为k的频繁项目集

来自分类Dev

Python:优化函数以找到给定候选项目集的大小为k的频繁项目集

来自分类Dev

连接点集的算法?

来自分类Dev

合并集的算法挑战

来自分类Dev

遍历整数集的算法

来自分类Dev

C ++位集算法

来自分类Dev

点集匹配算法

来自分类Dev

生成堆的算法

来自分类Dev

生成树分解的算法

来自分类Dev

生成和算法

来自分类Dev

生成树分解的算法

来自分类Dev

查找唯一项目集的算法,每个项目集中都有一个项目

来自分类Dev

推荐算法的数据集大小

来自分类Dev

计算包含某些项目的列表集的总唯一排列的算法