我有两个(或多个)数据框,我想相互附加(或以某种方式进行外部合并)。如何确保可以附加两个数据帧,但是同时,如果索引相同,我想使用第二个(dfB)数据帧更新变量的值。举例说明:
dfA =
Index Var1
A 5
B 6
C 7
dfB =
Index Var1
A 6
D 8
E 10
所需的输出应如下所示
output =
Index Var1
A 6
B 6
C 7
D 8
E 10
任何帮助将不胜感激!
谢谢
对于这种特殊情况,考虑到更新,可以pd.concat()
将参数ignore_index=True
与drop_duplicates(['index'])
output = pd.concat([dfA,dfB],ignore_index=True)drop_duplicates(['index'],keep='last')
例:
A = {'Index':['A','B','C'],'Var1':[5,6,7]}
B = {'Index':['A','D','E'],'Var1':[6,7,8]}
dfA = pd.DataFrame(A)
dfB = pd.DataFrame(B)
output = pd.concat([dfA,dfB],ignore_index=True).drop_duplicates(['Index'],keep='last')
print(output)
Index Var1
1 B 6
2 C 7
3 A 6
4 D 7
5 E 8
之后,您可以使用,set_index()
或者sort_values()
如果您要按照给定的列的字母顺序对数据框进行排序Index
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句