聚合数据框以给出元素和和分组索引的字符串

麦克风

我正在尝试使用groupby给我一些元素的总和或均值,以及每个组的原始行索引的字符串。因此,例如,数据框:

>>> df = pd.DataFrame([[1,2,3],[1,3,4],[2,3,4],[2,5,6],[7,8,3],[11,12,13],[11,2,3]],index = ['p','q','r','s','t','u','v'],columns =['a','b','c'])

    a   b   c
p   1   2   3
q   1   3   4
r   2   3   4
s   2   5   6
t   7   8   3
u  11  12  13
v  11   2   3

然后,我希望将df按“ a”分组,以给出:

     b    c    indices
1    5    7    p,q
2    8    10   r,s
7    8    3    t
11   14   16   u,v

到目前为止,我已经尝试过:

df.groupby('a').agg({'score' : np.sum, 'indices' : lambda x: ",".join(list(x.index.values))})

但是正在收到基于“索引”不存在的错误,有人可以建议我如何完成我要做的事情吗?

谢谢

瑞安·萨克斯(Ryan Saxe)

聚合的工作方式是给您一个键和一个值,其中键是一个现有的列名,而值是一个映射到该列的函数。

因此,要以所需的方式获得总和,请执行以下操作:

>>> grouped = df.groupby('a')
>>> grouped.agg({'b' : np.sum, 'c' : np.sum}).head()
     c   b
a         
1    7   5
2   10   8
7    3   8
11  16  14

但是您想知道第三列中已合并的行。因此,您实际上需要在此之前添加此列groupby这是完整的代码:

df['indices'] = range(len(df))
grouped = df.groupby('a')
final = grouped.agg({'b' : np.sum, 'c' : np.sum, 'indices': lambda x: ",".join(list(x.index.values))})

那么您将得到以下结果:

>>> final.head()
   indices   c   b
a                 
1      p,q   7   5
2      r,s  10   8
7        t   3   8
11     u,v  16  14

如果您还有其他疑问,请随时发表评论。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

包含字符串和数字的聚合数据框

来自分类Dev

枢轴,分组或聚合数据框

来自分类Dev

根据字符串值聚合数据

来自分类Dev

elasticsearch字符串聚合数组

来自分类Dev

以列名称为字符串的聚合数据表

来自分类Dev

以列名称为字符串的聚合数据表

来自分类Dev

用字符串对数据框的值进行分组

来自分类Dev

如何组合数据框中的字符串以列出和拆分列?

来自分类Dev

聚合数据框:数字列的加权平均值,其他类型的字符串串联

来自分类Dev

熊猫数据框-字符串索引必须为整数-

来自分类Dev

如何使用Pandas按日期和字符串multiIndex聚合数据,然后打印到.csv?

来自分类Dev

在熊猫数据框中找到字符串元素的位置

来自分类Dev

所有数据框元素的子字符串

来自分类Dev

数组元素上的sort_by给出错误“无法使用字符串“ key”索引字符串”

来自分类Dev

在Ruby中组合数组的字符串元素

来自分类Dev

按索引聚合数据透视表

来自分类Dev

从列表列创建聚合数据框

来自分类Dev

聚合数据框的 ggplot 缺失值

来自分类Dev

旋转包含字符串的Pandas数据框-'没有要聚合的数字类型'错误

来自分类Dev

熊猫从count()函数的数据框聚合max()返回字符串值

来自分类Dev

基于分组依据的SQL字符串聚合

来自分类Dev

Pyspark数据框列子字符串基于特定字符的索引值

来自分类Dev

按熊猫数据框列的相同部分字符串分组

来自分类Dev

熊猫数据框按列中的多个字符串分组

来自分类Dev

如何在熊猫数据框中执行分组,排序和连接字符串

来自分类Dev

Python按绑定到字符串的整数对数据框列进行分组排序

来自分类Dev

解析日期时间字符串给出索引21的错误

来自分类Dev

访问字符串的索引,但没有给出正确的答案

来自分类Dev

根据元素长度删除python数据框中的字符串元素

Related 相关文章

  1. 1

    包含字符串和数字的聚合数据框

  2. 2

    枢轴,分组或聚合数据框

  3. 3

    根据字符串值聚合数据

  4. 4

    elasticsearch字符串聚合数组

  5. 5

    以列名称为字符串的聚合数据表

  6. 6

    以列名称为字符串的聚合数据表

  7. 7

    用字符串对数据框的值进行分组

  8. 8

    如何组合数据框中的字符串以列出和拆分列?

  9. 9

    聚合数据框:数字列的加权平均值,其他类型的字符串串联

  10. 10

    熊猫数据框-字符串索引必须为整数-

  11. 11

    如何使用Pandas按日期和字符串multiIndex聚合数据,然后打印到.csv?

  12. 12

    在熊猫数据框中找到字符串元素的位置

  13. 13

    所有数据框元素的子字符串

  14. 14

    数组元素上的sort_by给出错误“无法使用字符串“ key”索引字符串”

  15. 15

    在Ruby中组合数组的字符串元素

  16. 16

    按索引聚合数据透视表

  17. 17

    从列表列创建聚合数据框

  18. 18

    聚合数据框的 ggplot 缺失值

  19. 19

    旋转包含字符串的Pandas数据框-'没有要聚合的数字类型'错误

  20. 20

    熊猫从count()函数的数据框聚合max()返回字符串值

  21. 21

    基于分组依据的SQL字符串聚合

  22. 22

    Pyspark数据框列子字符串基于特定字符的索引值

  23. 23

    按熊猫数据框列的相同部分字符串分组

  24. 24

    熊猫数据框按列中的多个字符串分组

  25. 25

    如何在熊猫数据框中执行分组,排序和连接字符串

  26. 26

    Python按绑定到字符串的整数对数据框列进行分组排序

  27. 27

    解析日期时间字符串给出索引21的错误

  28. 28

    访问字符串的索引,但没有给出正确的答案

  29. 29

    根据元素长度删除python数据框中的字符串元素

热门标签

归档