如何使用大熊猫中的groupby根据另一列中的条件计算百分比总数

fuzzy_logic_77 发表于 Dev

模糊逻辑_77

我正在尝试找出如何groupby在给定的Yes / No条件下在熊猫中使用该功能来计算出每年价值的比例。

例如，我有一个数据框，名为names：

  Name  Number  Year   Sex Criteria
0  name1     789  1998  Male      N
1  name1     688  1999  Male      N
2  name1     639  2000  Male      N
3  name2     551  1998  Male      Y
4  name2     499  1999  Male      Y

我可以用

namesgrouped = names.groupby(["Sex", "Year", "Criteria"]).sum()

要得到：

                   Number
Sex    Year      Criteria
Male   1998 N        14507
            Y         2308
       1999 N        14119
            Y         2331

等等。我希望“数字标准”列显示每种性别和年份在总数中所占的百分比-因此，对于1998年之前的N = 14507和Y = 2308，我将拥有N = 86.27％和Y = 13.73％。

谁能建议该怎么做？

伊恩斯

这个问题是建议的重复项的直接扩展。从公认的答案中借用，这将起作用：

In [46]: namesgrouped.groupby(level=[0, 1]).apply(lambda g: g / g.sum())
Out[46]: 
                      Number
Sex  Year Criteria          
Male 1998 N         0.588806
          Y         0.411194
     1999 N         0.579612
          Y         0.420388
     2000 N         1.000000

编辑：转换操作可能比应用更快：

namesgrouped / namesgrouped.groupby(level=[0, 1]).transform('sum')

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-28

我来说两句

0条评论

登录后参与评论

来自分类Dev

如何使用groupby计算熊猫数据框中特定列的总数百分比？

来自分类Dev

Groupby大熊猫计算百分比

来自分类Dev

使用data.table根据另一列中的类别来计算发生百分比

来自分类Dev

如何转置列并获取大熊猫中相同值的数量和百分比？

来自分类Dev

熊猫分组-基于另一列的值占分组总数的百分比

来自分类Dev

一列以上的groupby的熊猫百分比

来自分类Dev

根据另一列上的条件计算价格变化和价格的累计百分比变化

来自分类Dev

如何计算Spark SQL中总数的百分比

来自分类Dev

如何使用Pandas Groupby计算每列中总计的百分比

来自分类Dev

如何使用百分比制作大熊猫交叉表？

来自分类Dev

如何计算每一列的百分比？

来自分类Dev

如何返回2列之间的百分比，该百分比由SQL中的另一列分组？

来自分类Dev

SSAS计算得出的成员-如何根据另一种方法计算总数的百分比

来自分类Dev

计算SQL查询中两列之间的百分比作为另一列

来自分类Dev

SSRS根据行总数计算列的百分比

来自分类Dev

SQL中同一列的百分比

来自分类Dev

从同一列计算mysql中的百分比

来自分类Dev

计算我在一列中拥有零的百分比

来自分类Dev

在Pandas数据透视表中获取另一列的百分比

来自分类Dev

选择PostgreSQL中另一列的百分比

来自分类Dev

如何根据熊猫数据框中的多列获取百分比计数？

来自分类Dev

使用groupby操作计算熊猫百分比

来自分类Dev

如何计算列中的百分比？

来自分类Dev

如何计算r中的列百分比

来自分类Dev

如何使用另一种条件在 Access 中随机选择一定百分比的行？

来自分类Dev

根据每个唯一列值计算百分比

来自分类Dev

根据分子中是否包含值以及分母中是否包含唯一列值，按百分比计算分组

来自分类Dev

将值显示为熊猫数据透视表中列总数的百分比

来自分类Dev

根据groupby或大熊猫中的循环条件划分列

Related 相关文章

文章