我经常在熊猫中使用value_counts()方法获取统计信息。
例如,我可以得到value_counts()结果,如下所示。
male 7825
female 6764
是否有内置函数来获取对应于两个标签(男性和女性)的数据框索引。
预期结果:male_indices = [1,3,5,6,7, ..., 14589]
,其中len(male_indices)= 7825
这是做什么的groupby
。考虑示例数据框df
np.random.seed([3,1415])
df = pd.DataFrame(dict(sex=np.random.choice(('male', 'female'), 10)))
print(df)
sex
0 male
1 female
2 male
3 female
4 male
5 male
6 female
7 male
8 female
9 female
用 groupby.groups
df.groupby('sex').groups
{'female': Int64Index([1, 3, 6, 8, 9], dtype='int64'),
'male': Int64Index([0, 2, 4, 5, 7], dtype='int64')}
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句