处理缺失值(条件归因)熊猫

摩摩

我在处理丢失的数据时遇到障碍

我有这个df

index                   a          b     c      del 
2018-06-25 12:51:00    NaN        NaN   NaN      1
2018-06-25 12:52:00    NaN        NaN   NaN     NaN
2018-06-25 12:53:00    NaN        NaN   NaN     NaN 
2018-06-25 12:54:00    NaN        NaN   NaN     NaN 
2018-06-25 12:55:00    NaN        NaN   NaN     NaN
2018-06-25 12:56:00    NaN        NaN   NaN     NaN 
2018-06-25 12:57:00    NaN        NaN   NaN     NaN 
2018-06-25 12:58:00    0.5        0.6   0.6     0.0
2018-06-25 12:59:00    NaN        NaN   NaN     0.0
2018-06-25 13:00:00    0.6        0.8   0.6     0.0
2018-06-25 13:01:00    NaN        NaN   NaN     0.0 
2018-06-25 13:02:00    0.6        0.9   0.6     0.0

我想做的事

如果del不缺少值,插入缺失值

我有这个解决方案,当del有值时仅保留df,并在连接后进行插值

但我想避免串联以及过多的代码和变量行

dfs= df.loc[df['del'].notnull(),:]
dfs.interpolate(method='time')

dfs1= df.loc[df['del'].isnull(),:]

dfs= pd.concat([dfs,dfs1], axis=1, sort=True,  join_axes=[df.index])

期望的输出:

index                   a          b     c        del 
2018-06-25 12:51:00    NaN        NaN   NaN       1.0
2018-06-25 12:52:00    NaN        NaN   NaN       NaN
2018-06-25 12:53:00    NaN        NaN   NaN       NaN 
2018-06-25 12:54:00    NaN        NaN   NaN       NaN 
2018-06-25 12:55:00    NaN        NaN   NaN       NaN
2018-06-25 12:56:00    NaN        NaN   NaN       NaN 
2018-06-25 12:57:00    NaN        NaN   NaN       NaN 
2018-06-25 12:58:00    0.5        0.6   0.6       0.0
2018-06-25 12:59:00    0.6        0.7   0.7       0.0
2018-06-25 13:00:00    0.6        0.8   0.6       0.0
2018-06-25 13:01:00    0.7        0.9   0.7       0.0 
2018-06-25 13:02:00    0.6        0.9   0.6       0.0

只是逐个关闭小洞的故事

谢谢<<

洛兹

使用.loc仅分配插在那里'del'不为空:

df.loc[df['del'].notnull()] = df.loc[df['del'].notnull()].interpolate(method='time')

                        a     b    c  del
2018-06-25 12:51:00   NaN   NaN  NaN  1.0
2018-06-25 12:52:00   NaN   NaN  NaN  NaN
2018-06-25 12:53:00   NaN   NaN  NaN  NaN
2018-06-25 12:54:00   NaN   NaN  NaN  NaN
2018-06-25 12:55:00   NaN   NaN  NaN  NaN
2018-06-25 12:56:00   NaN   NaN  NaN  NaN
2018-06-25 12:57:00   NaN   NaN  NaN  NaN
2018-06-25 12:58:00  0.50  0.60  0.6  0.0
2018-06-25 12:59:00  0.55  0.70  0.6  0.0
2018-06-25 13:00:00  0.60  0.80  0.6  0.0
2018-06-25 13:01:00  0.60  0.85  0.6  0.0
2018-06-25 13:02:00  0.60  0.90  0.6  0.0

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

熊猫根据缺失值的条件逻辑添加新列

来自分类Dev

缺失值的处理

来自分类Dev

熊猫发现并插入缺失值

来自分类Dev

使用dtype处理大熊猫中的缺失值以读取文件

来自分类Dev

处理Growthcurver中的缺失值

来自分类Dev

处理缺失的分类值ML

来自分类Dev

如何使用数据条件填充熊猫数据框中的缺失值?

来自分类Dev

熊猫:归因NaN

来自分类Dev

熊猫:归因于NaN

来自分类Dev

删除缺失值超过阈值熊猫的列

来自分类Dev

使用error ='coerce'的熊猫缺失值

来自分类Dev

在熊猫中按ID填充缺失值

来自分类Dev

填充缺失值熊猫数据框

来自分类Dev

使用熊猫更新列中的缺失值

来自分类Dev

处理熊猫的离群值

来自分类Dev

spark如何处理缺失值?

来自分类Dev

使用Weka处理关联规则的缺失值

来自分类Dev

处理Python Lambda函数中的缺失值

来自分类Dev

Python JSON解析处理缺失值

来自分类Dev

处理表命令中的缺失值

来自分类Dev

使用Weka处理关联规则的缺失值

来自分类Dev

Spark如何处理缺失值?

来自分类Dev

Excel 2016:条件文本 + 缺失值的意义

来自分类Dev

熊猫中各行的唯一值缺失值

来自分类Dev

如何使用熊猫根据列模式填充缺失值?

来自分类Dev

使用熊猫读取包含某些缺失值的CSV

来自分类Dev

使用均值填写熊猫数据框中的缺失值

来自分类Dev

熊猫通过切片计算CAGR(缺失值)

来自分类Dev

填写大熊猫数据帧的缺失值