聚合数据框以给出元素和和分组索引的字符串

debugcn 发表于 Dev

麦克风

我正在尝试使用groupby给我一些元素的总和或均值，以及每个组的原始行索引的字符串。因此，例如，数据框：

>>> df = pd.DataFrame([[1,2,3],[1,3,4],[2,3,4],[2,5,6],[7,8,3],[11,12,13],[11,2,3]],index = ['p','q','r','s','t','u','v'],columns =['a','b','c'])

    a   b   c
p   1   2   3
q   1   3   4
r   2   3   4
s   2   5   6
t   7   8   3
u  11  12  13
v  11   2   3

然后，我希望将df按“ a”分组，以给出：

     b    c    indices
1    5    7    p,q
2    8    10   r,s
7    8    3    t
11   14   16   u,v

到目前为止，我已经尝试过：

df.groupby('a').agg({'score' : np.sum, 'indices' : lambda x: ",".join(list(x.index.values))})

但是正在收到基于“索引”不存在的错误，有人可以建议我如何完成我要做的事情吗？

谢谢

瑞安·萨克斯（Ryan Saxe）

聚合的工作方式是给您一个键和一个值，其中键是一个现有的列名，而值是一个映射到该列的函数。

因此，要以所需的方式获得总和，请执行以下操作：

>>> grouped = df.groupby('a')
>>> grouped.agg({'b' : np.sum, 'c' : np.sum}).head()
     c   b
a         
1    7   5
2   10   8
7    3   8
11  16  14

但是您想知道第三列中已合并的行。因此，您实际上需要在此之前添加此列groupby！这是完整的代码：

df['indices'] = range(len(df))
grouped = df.groupby('a')
final = grouped.agg({'b' : np.sum, 'c' : np.sum, 'indices': lambda x: ",".join(list(x.index.values))})

那么您将得到以下结果：

>>> final.head()
   indices   c   b
a                 
1      p,q   7   5
2      r,s  10   8
7        t   3   8
11     u,v  16  14

如果您还有其他疑问，请随时发表评论。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-5

我来说两句

0条评论

登录后参与评论

来自分类Dev

包含字符串和数字的聚合数据框

来自分类Dev

枢轴，分组或聚合数据框

来自分类Dev

根据字符串值聚合数据

来自分类Dev

elasticsearch字符串聚合数组

来自分类Dev

以列名称为字符串的聚合数据表

来自分类Dev

以列名称为字符串的聚合数据表

来自分类Dev

用字符串对数据框的值进行分组

来自分类Dev

如何组合数据框中的字符串以列出和拆分列？

来自分类Dev

聚合数据框：数字列的加权平均值，其他类型的字符串串联

来自分类Dev

熊猫数据框-字符串索引必须为整数-

来自分类Dev

如何使用Pandas按日期和字符串multiIndex聚合数据，然后打印到.csv？

来自分类Dev

在熊猫数据框中找到字符串元素的位置

来自分类Dev

所有数据框元素的子字符串

来自分类Dev

数组元素上的sort_by给出错误“无法使用字符串“ key”索引字符串”

来自分类Dev

在Ruby中组合数组的字符串元素

来自分类Dev

按索引聚合数据透视表

来自分类Dev

从列表列创建聚合数据框

来自分类Dev

聚合数据框的 ggplot 缺失值

来自分类Dev

旋转包含字符串的Pandas数据框-'没有要聚合的数字类型'错误

来自分类Dev

熊猫从count（）函数的数据框聚合max（）返回字符串值

来自分类Dev

基于分组依据的SQL字符串聚合

来自分类Dev

Pyspark数据框列子字符串基于特定字符的索引值

来自分类Dev

按熊猫数据框列的相同部分字符串分组

来自分类Dev

熊猫数据框按列中的多个字符串分组

来自分类Dev

如何在熊猫数据框中执行分组，排序和连接字符串

来自分类Dev

Python按绑定到字符串的整数对数据框列进行分组排序

来自分类Dev

解析日期时间字符串给出索引21的错误

来自分类Dev

访问字符串的索引，但没有给出正确的答案

来自分类Dev

根据元素长度删除python数据框中的字符串元素

Related 相关文章

文章