如何使用Weka将此数据集用于Apriori算法?
'A, C, D',
'B, C, E',
'A, B, C, E',
'B, E'
您需要将其转换为.arff
格式。
.arff
文件的格式很简单,由三个字段组成:
@relation
@attribute
@data
在这种情况下,如果只有一个字段(本例中为“字母”),则应在属性字段中列出所有可能的属性(A,B,C,..),然后将其格式化(在数据字段中) )使用布尔值来描述每行中特定属性的存在/不存在。
例子:
@relation <file_name>
@attribute 'A' { t}
@attribute 'B' { t}
@attribute 'C' { t}
@attribute 'D' { t}
@attribute 'E' { t}
@data
t, ?, t, t, ?
?, t, t, ?, t
t, t, t, ?, t
?, t, ?, ?, t
作为另一个示例,请查看Weka数据文件夹中的“ supermarket.arff”示例。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句