我正在使用Apriori算法来识别客户的频繁项目集。基于已识别的频繁项目集,当客户将新项目添加到购物清单时,我想向客户提示建议项目,作为频繁项目集,我得到了结果如下;
[1],[3],[2],[5]
[2.3],[3,5],[1,3],[2,5]
[2,3,5]
我的问题是,如果我仅考虑设置[2,3,5]来向客户提出建议,那我错了吗?例如,如果客户将项目3添加到他的购物清单中,我会推荐项目2和项目5。如果客户将项目1添加到购物清单中,则不会提出任何建议,因为我考虑的是仅设置[2,3,5]而项目1是在该集合中不可用。我想知道我的逻辑(仅考虑集合[2,3,5])是否足以为用户提供建议
否。推导推荐规则需要更多的努力。
仅仅因为[2,3,5]频繁并不能意味着2 - > 3,5是一个很好的规则。
考虑一下2是非常受欢迎的产品,但3,5只是很少出现的情况。考虑加油站。[天然气,咖啡,百吉饼]可能是经常使用的商品,但是购买天然气的顾客很少,他们也会购买咖啡和百吉饼(低置信度)。
您确实要考虑诸如2,3-> 5之类的规则,因为它们可能具有更高的置信度。即,如果客户购买汽油和咖啡,则建议面包圈。
频率不足以推荐!考虑在80%的情况下购买了2和3。2、3、5在60%的情况下被购买。天真的,在8次中有6次,客户还将购买5次,这是正确率的75%!但这并不意味着5是一个很好的建议!因为5占总数的80%,所以如果他购买2和3,则实际上购买5的可能性要小5%,而我们在这里有负相关。这就是为什么您也需要研究一下举升机的原因。或类似的其他措施,有很多。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句