df
在执行一些groupby.size()
操作后,我得到了这个简单的多索引数据框:
U G C
1 1 en 0.600000
2 en 0.400000
2 1 es 0.333333
3 es 0.500000
我只想屏蔽相对于U
索引列具有最后一列最大值的行。到目前为止,我尝试通过以下方式进行分组:
mask = df.groupby(level=[0]).max()
返回:
U
1 0.6
2 0.5
但我需要数据框的整个结构:
U G C
1 1 en
2 3 es
如何以某种方式重置多索引数据框?
为您df
:
data
U G C
1 1 en 0.600000
2 en 0.400000
2 1 es 0.333333
3 es 0.500000
您可以使用
df[df['data'] == df.groupby(level=[0])['data'].transform(max)]
哪个返回
data
U G C
1 1 en 0.6
2 3 es 0.5
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句