阿尼班
我正在实施数据挖掘算法。我最小的对象是一组。一组可以包含单个项目或多个项目(项目集)。我需要将这样的集合在字典中的出现计数为:
Dict={set([<some items>] : count)}
由于以下原因,我需要这样的数据类型:
- 不考虑集合中项目的顺序(item1,item2,item3与item2,item3,item1等...)
- 将集合添加到字典将避免重复键。
- 将计数与项目集一起存储在相同的数据结构中。
您能建议用python实现此目的的最简单方法吗?
沉默的
您可以使用Counter
withfrozenset
作为键:
from collections import Counter
items = [
[1, 2, 3],
[1, 2],
[3, 2, 1]
]
c = Counter(frozenset(x) for x in items)
print(c) # Counter({frozenset([1, 2, 3]): 2, frozenset([1, 2]): 1})
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
编辑于
我来说两句