我正在做“数据挖掘入门”的练习,并且陷入了以下问题:
哪种方法(雅卡德距离或汉明距离)更类似于简单匹配系数,哪种方法更类似于余弦量度?解释。(请注意:汉明测度是一个距离,而其他三个测度是相似的,但是不要让此混淆。)
我认为汉明距离与SMC相似,因为它们都查看整个数据集并比较相似或不相似的数据点。但是本书的解决方案如下:
汉明距离类似于SMC。实际上,SMC =汉明距离/位数。
解决方案出错了吗?我认为汉明距离和SMC不相等,汉明距离加SMC等于1。
汉明/长度= 1-SMC
是非常牢固的关系。因此,它们在功能上是等效的。
您所说的“看整个数据集”是错误的,每个是在一对对象上定义的?
这项练习的目的是练习您的基本数学技能,并将方程式相互转化。这是您经常需要的一项技能:
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句