我有两个集合,训练集和测试集,其中有些值为 NA,我需要 R 语言中的代码或指南来设置 NA 的值。谢谢....
您在随后的评论中询问是否可以用零以外的值替换 NA。你可以。一种方法是均值插补(以下代码转载自r博主:
df = data.frame(x = 1:20, y = c(1:10,rep(NA,10)))
df$y[is.na(df$y)] = mean(df$y, na.rm=TRUE)
重要的是您要了解均值插补是否适合您的数据(或任何其他这种方式的插补)关于均值插补问题的简短博客文章
请谨慎使用。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句