熊猫合并中的汇总映射值

翅膀

我有一个熊猫数据框:

import pandas as pd
df = pd.DataFrame({"a": [["x","y"]], "b": [2]})
df2= pd.DataFrame({"a": ["x","y"], "b":[2,2], "c": [3,4]})

哪里df.a有列表条目:

    a           b   
0   ["x","y"]   2

并将df2这些列表元素(以及其他列的条目)映射到列c:

    a       b   c
0   "x"     2   3
1   "y"     2   4

我想离开加入df, df2,最终得到:

    a           b   c
0   ["x","y"]   2   7

其中聚合(在这种情况下为和)是从键a,b映射的值c上进行的。

缺乏需求

我的想法是首先在df1中创建一个唯一键,这样它可以保留a列中列表的分组,从而允许您在> 0.25的熊猫中使用df.explode。我还添加了另一行以测试其工作方式:

df1['key'] = (df1.a != df1.a.shift()).cumsum()
df1 = df1.explode('a')
df = df1.merge(df2)
df = df.groupby('key').agg({'a': list, 'b': 'first', 'c': sum}).reset_index(drop=True)

print(df)
        a  b   c
0  [x, y]  2   7
1     [z]  3  10

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

汇总熊猫中的列值并将总计附加或合并到数据框?

来自分类Dev

汇总熊猫中的列值并将总计附加或合并到数据框?

来自分类Dev

熊猫中多列类别值的映射

来自分类Dev

如何映射到熊猫列表中的值

来自分类Dev

熊猫根据多列中的值映射

来自分类Dev

如何映射熊猫中的列值?

来自分类Dev

随后如何汇总熊猫时间序列中的值

来自分类Dev

汇总熊猫GroupBy中的多个列值作为dict

来自分类Dev

熊猫在合并期间汇总一列

来自分类Dev

映射列值熊猫

来自分类Dev

在列上映射序列中的值以替换nan值熊猫

来自分类Dev

熊猫与插值合并

来自分类Dev

熊猫:合并系列值

来自分类Dev

在字典中合并/汇总字典

来自分类Dev

如何在熊猫中另一列的值之间汇总一列中的值

来自分类Dev

熊猫DataFrame。汇总列中的值取决于另一列中的值

来自分类Dev

将多个项目映射到熊猫数据框中的值

来自分类Dev

熊猫根据列中的相同值合并数据框

来自分类Dev

仅当熊猫中的值为空/空时才合并

来自分类Dev

如何在熊猫中合并多列值?

来自分类Dev

根据列中的值合并熊猫数据框

来自分类Dev

合并熊猫中同一数据框内的列值

来自分类Dev

合并和“展开”引用熊猫中的行值

来自分类Dev

根据多个值合并熊猫数据框中的行

来自分类Dev

根据多个值合并熊猫数据框中的行

来自分类Dev

在熊猫中合并列并加入非缺失值

来自分类Dev

将多列中的行值汇总到熊猫df中的新列中

来自分类Dev

汇总列表中的值

来自分类Dev

熊猫-DataFrames之间的映射值