我有一个以日期和小时为列的熊猫数据框。现在,我想添加相同日期的小时数。例如要这样做:
7-1-2016 | 4
7-1-2016 | 2
4-1-2016 | 5
变成这个:
7-1-2016 | 6
4-1-2016 | 5
有没有在大文件上执行此操作的快速方法?
这里GroupBy
可用于提供所需的输出。
DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False)
使用映射器(dict或键函数,将给定函数应用于组,将结果作为序列返回)或按一系列列对系列进行分组。
尝试:
df.groupby('date')['hours'].sum()
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句