可以说我刚刚计算了一个相关矩阵。现在,使用大熊猫数据框,我希望获得与其轴名称就位的最高相关性。
例如:
a, b, c, d, e, f
a, 0, 1, 2, 3, 4, 5,
b, 1, 0, 3, 4, 5, 6,
c, 2, 3, 0, 5, 6, 7,
d, 3, 4, 5, 0, 7, 8,
e, 4, 5, 6, 7, 0, 9,
f, 5, 6, 7, 8, 9, 0
得到:
e f 9
f d 8
f c 7
e d 7
等等...
我已经阅读了pandas文档,并看到了groupby方法以及诸如head之类的功能,但是我对应该如何执行此操作有些困惑。
您可以stack
在这里使用,这将产生一个带有索引中行和列信息的系列,然后调用nlargest
该系列:
>>> df.stack()
a a 0
b 1
c 2
d 3
e 4
f 5
b a 1
b 0
c 3
[etc.]
>>> df.stack().nlargest(6)
e f 9
f e 9
d f 8
f d 8
c f 7
d e 7
dtype: int64
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句