Apriori算法-频繁项目集生成

debugcn 发表于 Dev

用户名

我正在使用Apriori算法来识别客户的频繁项目集。基于已识别的频繁项目集，当客户将新项目添加到购物清单时，我想向客户提示建议项目，作为频繁项目集，我得到了结果如下;

[1],[3],[2],[5]
[2.3],[3,5],[1,3],[2,5]
[2,3,5]

我的问题是，如果我仅考虑设置[2,3,5]来向客户提出建议，那我错了吗？例如，如果客户将项目3添加到他的购物清单中，我会推荐项目2和项目5。如果客户将项目1添加到购物清单中，则不会提出任何建议，因为我考虑的是仅设置[2,3,5]而项目1是在该集合中不可用。我想知道我的逻辑（仅考虑集合[2,3,5]）是否足以为用户提供建议

有QUIT--Anony-Mousse

否。推导推荐规则需要更多的努力。

仅仅因为[2,3,5]频繁并不能意味着2 - > 3,5是一个很好的规则。

考虑一下2是非常受欢迎的产品，但3,5只是很少出现的情况。考虑加油站。[天然气，咖啡，百吉饼]可能是经常使用的商品，但是购买天然气的顾客很少，他们也会购买咖啡和百吉饼（低置信度）。

您确实要考虑诸如2,3-> 5之类的规则，因为它们可能具有更高的置信度。即，如果客户购买汽油和咖啡，则建议面包圈。

频率不足以推荐！考虑在80％的情况下购买了2和3。2、3、5在60％的情况下被购买。天真的，在8次中有6次，客户还将购买5次，这是正确率的75％！但这并不意味着5是一个很好的建议！因为5占总数的80％，所以如果他购买2和3，则实际上购买5的可能性要小5％，而我们在这里有负相关。这就是为什么您也需要研究一下举升机的原因。或类似的其他措施，有很多。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-20

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

Apriori算法-频繁项目集生成

Apriori算法-频繁项目集生成

生成Apriori算法的候选项目集

Weka Apriori算法转换数据集

Apriori算法使用R生成所有规则

无法使用 Apriori 算法生成规则列表

对于大数据集，如何在 R 中使用 apriori 算法？

如何在R中使用apriori找到频繁项集？

Apriori算法中的词典顺序

使用Apriori算法无输出

Apriori算法运行时间

在Weka中使用Apriori算法获取频率

如何在H2O中实现Apriori算法？

生成功率集算法？

生成所有多集size-n分区的算法

生成所有多集size-n分区的算法

什么是频繁使用最快的levenshtein算法

Python：优化函数以找到给定候选项目集的大小为k的频繁项目集

Python：优化函数以找到给定候选项目集的大小为k的频繁项目集

连接点集的算法？

合并集的算法挑战

遍历整数集的算法

C ++位集算法

点集匹配算法

生成堆的算法

生成树分解的算法

生成和算法

生成树分解的算法

查找唯一项目集的算法，每个项目集中都有一个项目

推荐算法的数据集大小

计算包含某些项目的列表集的总唯一排列的算法