我的数据框 df 有数字和非数字列
我只想在数字列中用平均值填充空值
我可以做这个
numerics = ['int16', 'int32', 'int64', 'float16', 'float32', 'float64']
df = df.select_dtypes(exclude=numerics)
df.fillna(df.mean())
但我会丢失非数字字段
我想同时用均值填充 NA 以免丢失分类列
怎么做?
我认为您可以使用存储数字数据
df.select_dtypes(exclude=numerics).fillna(df.mean())
然后将非数字数据与数字数据结合起来
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句