输入:
df = pd.DataFrame({
'a':['1',np.nan,np.nan, '2',np.nan,np.nan],
'b':['a',np.nan,'ddd',np.nan,'d','gg'],
'c':[np.nan,'aa','bb',np.nan,'d',np.nan],
})
print (df)
a b c
0 1 a NaN
1 NaN NaN aa
2 NaN ddd bb
3 2 NaN NaN
4 NaN d d
5 NaN gg NaN
输出:
a b c
0 1 a ddd aa bb
1 2 d gg d
如果每个组的开始都没有缺失值,则ffill
用于向前填充缺失值并将所有值与join
已删除的缺失值进行汇总:
df = df.groupby(df['a'].ffill()).agg(lambda x: ' '.join(x.dropna())).reset_index(drop=True)
print (df)
a b c
0 1 a ddd aa bb
1 2 d gg d
详细说明:
print (df['a'].ffill())
0 1
1 1
2 1
3 2
4 2
5 2
Name: a, dtype: object
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句