假设我有以下两个熊猫数据框:
dt1 = {'date':['2020-05-18', '2020-05-19', '2020-05-20', '2020-05-21'], 'X1':[20, 21, 19, 18], 'X2':[23, 45, 16, 8]}
df1 = pd.DataFrame(dt1)
和
dt2 = {'date':['2020-04-18', '2020-05-19', '2020-05-22'], 'X1':[20, 19, 18], 'X2':[23, 16, 8]}
df2 = pd.DataFrame(dt2)
我想根据相应的日期获得每列的差异。对于以上数据框,预期输出为:
dt3 = {'date':['2020-05-19'], 'X1':[2], 'X2':[29]}
df3 = pd.DataFrame(dt3)
显然,我的数据帧要大得多,但是想法是一样的。我怎样才能达到这个结果?
让我们尝试
df3=(df1.set_index('date')-df2.set_index('date')).dropna().reset_index()
date X1 X2
0 2020-05-19 2.0 29.0
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句