透视大熊猫中的数据

克里兹

假设我有以下数据作为熊猫数据框:

               type      exdiv    paydate  amount
declared                                         
2014-01-31    final 2014-03-03 2014-03-10    3.10
2014-06-27  interim 2014-08-11 2014-08-18    1.55
2015-01-30    final 2015-03-02 2015-03-09    2.33
2015-01-30    final 2015-03-02 2015-03-09    0.77
2015-06-26  interim 2015-08-07 2015-08-17    1.80
2016-01-29    final 2016-02-29 2016-03-07    3.45

2015-01-30条目重复两次。汇总该行的最简单方法是什么,以使我在2015-01-30中只有一个等于3.10的条目?

到目前为止,我已经尝试了以下方法:

x=pd.pivot_table(df, values='amount', index=['exdiv','paydate','type'], columns=[])

但这会创建一个多索引,并且我不能使用当前的索引列(“已声明”)。

我知道我可以将索引添加为普通列,运行命令并尝试将多索引转换回单个索引,但是我确定在熊猫中必须有更好的方法吗?

耶斯列尔

transform搭配使用drop_duplicates

df['amount'] = df.groupby(level=0)['amount'].transform(sum)
df = df.reset_index().drop_duplicates(subset=['declared','type','exdiv','paydate'])
print (df)
     declared     type       exdiv     paydate  amount
0  2014-01-31    final  2014-03-03  2014-03-10    3.10
1  2014-06-27  interim  2014-08-11  2014-08-18    1.55
2  2015-01-30    final  2015-03-02  2015-03-09    3.10
4  2015-06-26  interim  2015-08-07  2015-08-17    1.80
5  2016-01-29    final  2016-02-29  2016-03-07    3.45

或添加reset_indexaggfunc=sumpivot_table

x=pd.pivot_table(df.reset_index(), 
                 values='amount', 
                 index=['declared','exdiv','paydate','type'], 
                 aggfunc=sum).reset_index()
print (x)
     declared       exdiv     paydate     type  amount
0  2014-01-31  2014-03-03  2014-03-10    final    3.10
1  2014-06-27  2014-08-11  2014-08-18  interim    1.55
2  2015-01-30  2015-03-02  2015-03-09    final    3.10
3  2015-06-26  2015-08-07  2015-08-17  interim    1.80
4  2016-01-29  2016-02-29  2016-03-07    final    3.45

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

透视大熊猫数据并添加列

来自分类Dev

数据透视表还是大熊猫分组依据?

来自分类Dev

规范大熊猫中的长数据

来自分类Dev

映射大熊猫中的分类数据?

来自分类Dev

如何量化大熊猫中的数据?

来自分类Dev

规范大熊猫中的长数据

来自分类Dev

将大熊猫中的CSV文件导入大熊猫数据框

来自分类Dev

过滤出大熊猫数据框中的数据

来自分类Dev

大熊猫数据框中的不同连续块

来自分类Dev

如何填写大熊猫中丢失的GPS数据?

来自分类Dev

迭代时更新大熊猫中的数据框

来自分类Dev

替换大熊猫数据框中的列值

来自分类Dev

大熊猫数据框中仅某些列的总和

来自分类Dev

大熊猫列数据作为情节中的标记?

来自分类Dev

大熊猫数据框中的布尔索引

来自分类Dev

大熊猫中每组的数据处理

来自分类Dev

在特定的时间间隔大熊猫透视表

来自分类常见问题

分割大熊猫数据框

来自分类Dev

从长到宽的数据。大熊猫

来自分类Dev

计算大熊猫数据框的元组

来自分类Dev

处理大熊猫的月度合并数据

来自分类Dev

大熊猫数据框并行处理

来自分类Dev

多指标大熊猫从数据帧

来自分类Dev

在大熊猫枢轴数据帧?

来自分类Dev

大熊猫-合并数据集

来自分类Dev

大熊猫数据帧的减法

来自分类Dev

大熊猫数据帧的插值

来自分类Dev

与Matplotlib不同的大熊猫中的散点图

来自分类Dev

大熊猫中的布尔子集