如何使用预先训练的模型填补缺失的价值?

萨基卜·沙里亚(Sakib Shahriar)

我有一个时间序列索引,几乎没有变量和湿度读数。我已经训练了一个ML模型来基于X,Y和Z预测湿度值。现在,当我使用pickle加载保存的模型时,我想使用X,Y和Z填充湿度缺失值。但是,应该考虑一下X,Y和Z本身不应该丢失的事实。

Time                    X        Y        Z       Humidity
1/2/2017 13:00          31       22       21           48
1/2/2017 14:00          NaN      12       NaN          NaN
1/2/2017 15:00          25       55       33           NaN

在此示例中,将使用模型填充最后一行湿度。由于模型X和Z也缺失,因此模型不应预测第二行。

到目前为止,我已经尝试过了:

with open('model_pickle','rb') as f:
    mp = pickle.load(f)

for i, value in enumerate(df['Humidity'].values):
    if np.isnan(value):
        df['Humidity'][i] = mp.predict(df['X'][i],df['Y'][i],df['Z'][i])

这给了我一个错误“ predict()从2到5个位置参数,但给了6个位置参数”,并且我没有考虑X,Y和Z列值。以下是我用来训练模型并将其保存到文件中的代码:

df = df.dropna()

dfTest = df.loc['2017-01-01':'2019-02-28']
dfTrain = df.loc['2019-03-01':'2019-03-18'] 
features = [ 'X', 'Y', 'Z'] 
train_X = dfTrain[features]
train_y = dfTrain.Humidity
test_X = dfTest[features]
test_y = dfTest.Humidity

model = xgb.XGBRegressor(max_depth=10,learning_rate=0.07)
model.fit(train_X,train_y)
predXGB = model.predict(test_X)
mae = mean_absolute_error(predXGB,test_y)
import pickle
with open('model_pickle','wb') as f:
    pickle.dump(model,f)

在训练和保存模型期间,我没有任何错误。

傻瓜

为了进行预测,由于您要确保拥有所有X,Y,Z值,因此可以这样做,

df = df.dropna(subset = ["X", "Y", "Z"])

现在,您可以预测其余有效示例的值,如下所示:

# where features = ["X", "Y", "Z"]
df['Humidity'] = mp.predict(df[features]) 

mp.predict将返回所有行的预测,因此无需进行迭代预测。

编辑:。

为了进行推断,假设您有一个dataframe df,可以做到,

# Get rows with missing Humidity where it can be predicted.
df_inference = df[df.Humidity.isnull()]

# remaining rows
df = df[df.Humidity.notnull()]

# This might still have rows with missing features.
# Since you cannot infer with missing features, Remove them too and add them to remaining rows
df = df.append(df_inference[df_inference[features].isnull().any(1)])

# and remove them from df_inference
df_inference = df_inference[~df_inference[features].isnull().any(1)]

#Now you can infer on these rows
df_inference['Humidity'] = mp.predict(df_inference[features])

# Now you can merge this back to the remaining rows to get the original number of rows and sort the rows by index
df = df.append(df_inference)
df.sort_index()

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

填补缺失值

来自分类Dev

PHP-如何在日期数组中查找缺失的日期并填补缺失的空白

来自分类Dev

MongoDB aggreagte填补缺失的日子

来自分类Dev

Python 2.7熊猫来填补缺失的数字/系列

来自分类Dev

如何使用gensim load_word2vec_format加载预先训练的手套模型?

来自分类Dev

R中有没有办法填补缺少观察的缺失群体?

来自分类Dev

下载havingface预先训练的模型

来自分类Dev

建议如何使用Yolov4训练预训练模型?

来自分类Dev

如何使用Tensorflow在C ++中训练模型?

来自分类Dev

如何使用SelectKBest选择的功能训练模型?

来自分类Dev

如何使用Tensorflow在C ++中训练模型?

来自分类Dev

如何使用pca的矩阵结果训练模型?

来自分类Dev

如何使用优化的权重训练模型?

来自分类Dev

某些小时的空白数据 - 因此在我的数组中丢失。有没有办法填补缺失的时间?

来自分类Dev

在Keras中训练模型时价值错误

来自分类Dev

如何使用python将新的csv文件数据添加到训练LSTM模型中以预测下一个未来价值

来自分类Dev

将图像提供给预先训练的keras模型

来自分类Dev

无法从动物园下载预先训练的模型

来自分类Dev

我正在尝试使用Tensorflow检测眼睛。有没有预先训练好的眼睛检测模型?

来自分类Dev

如何使用预先训练的网络对新的音频文件进行预测?

来自分类Dev

在距离矩阵中插补缺失数据

来自分类Dev

解决行之间的互补缺失值

来自分类Dev

填补组中的缺失值

来自分类Dev

如何使用Tensorflow数据集进行CNN模型训练

来自分类Dev

如何在Python中使用预训练的CNN模型

来自分类Dev

如何使用Tensorflow数据集进行CNN模型训练

来自分类Dev

如何使用Tf-idf功能来训练模型?

来自分类Dev

如何使用scikit-learn训练XOR模型?

来自分类Dev

如何在 Tensorflow 中使用预训练模型?

Related 相关文章

  1. 1

    填补缺失值

  2. 2

    PHP-如何在日期数组中查找缺失的日期并填补缺失的空白

  3. 3

    MongoDB aggreagte填补缺失的日子

  4. 4

    Python 2.7熊猫来填补缺失的数字/系列

  5. 5

    如何使用gensim load_word2vec_format加载预先训练的手套模型?

  6. 6

    R中有没有办法填补缺少观察的缺失群体?

  7. 7

    下载havingface预先训练的模型

  8. 8

    建议如何使用Yolov4训练预训练模型?

  9. 9

    如何使用Tensorflow在C ++中训练模型?

  10. 10

    如何使用SelectKBest选择的功能训练模型?

  11. 11

    如何使用Tensorflow在C ++中训练模型?

  12. 12

    如何使用pca的矩阵结果训练模型?

  13. 13

    如何使用优化的权重训练模型?

  14. 14

    某些小时的空白数据 - 因此在我的数组中丢失。有没有办法填补缺失的时间?

  15. 15

    在Keras中训练模型时价值错误

  16. 16

    如何使用python将新的csv文件数据添加到训练LSTM模型中以预测下一个未来价值

  17. 17

    将图像提供给预先训练的keras模型

  18. 18

    无法从动物园下载预先训练的模型

  19. 19

    我正在尝试使用Tensorflow检测眼睛。有没有预先训练好的眼睛检测模型?

  20. 20

    如何使用预先训练的网络对新的音频文件进行预测?

  21. 21

    在距离矩阵中插补缺失数据

  22. 22

    解决行之间的互补缺失值

  23. 23

    填补组中的缺失值

  24. 24

    如何使用Tensorflow数据集进行CNN模型训练

  25. 25

    如何在Python中使用预训练的CNN模型

  26. 26

    如何使用Tensorflow数据集进行CNN模型训练

  27. 27

    如何使用Tf-idf功能来训练模型?

  28. 28

    如何使用scikit-learn训练XOR模型?

  29. 29

    如何在 Tensorflow 中使用预训练模型?

热门标签

归档