使用当前无效的输入数据进行预测

debugcn 发表于 Dev

冠心病

假设我们有一些数据（输入），我们希望以此数据来预测一些输出。如果特定输入可以采用的可能值随着时间而改变，那么使用所有数据是否仍然合适？

让我尝试用一个例子来澄清。假设输入之一是[A, B, C]在数据中具有唯一值的分类变量，但是我们知道，在当前将最终进行预测的当前设置中，只有这些值[A, B]是可能的。

使用所有数据还是合适的，还是应该C排除所有包含a的观测值？

弥耶

IfC不是唯一地映射到Target变量，而是与Aor / and共享一些目标变量B。在这种情况下，留C在数据集中，知道它肯定不会在将来的输入中发生（即，您预测未见输入的位置），将调整模型的假设（并且取决于模型，线性模型更多）因此，最终假设将基于冗余信息。

简单来说：In-Sample不代表Out-of-Sample，因此它会过拟合并且不会泛化！

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-2

我来说两句

0条评论

登录后参与评论

来自分类Dev

尝试使用Try catch进行while循环，直到用户正确回答而不输入无效数据（Java）

来自分类Dev

使用保存的 CNN 模型对输入文本的单个评论进行预测

来自分类Dev

使用Sapply进行R数据选择无效

来自分类Dev

使用rpart决策树进行数据预测

来自分类Dev

在Shiny中使用反应性数据框进行预测（SVM）

来自分类Dev

使用当前日期时间和过去历史预测用户输入

来自分类Dev

重塑数据帧以进行预测

来自分类Dev

如何对预测数据进行分类

来自分类Dev

使用预测包在R中进行预测

来自分类Dev

使用AutoBench对大型输入进行测试时，无效标准报告

来自分类Dev

在输入向量中传递NAN以进行预测

来自分类Dev

使用Powershell进行输入验证/数据过滤

来自分类Dev

使用固定输入变量进行回归预测的等高线图

来自分类Dev

使用统计模型进行预测

来自分类常见问题

使用TensorFlow模型进行预测

来自分类Dev

使用lapply从列表进行预测

来自分类Dev

使用Java进行预测分析

来自分类Dev

使用Prolog基于关系数据库中的数据进行预测

来自分类Dev

Prophet 通过 id 进行预测并使用提前一个月的预测填充数据框

来自分类Dev

如何使用当前保存在数据库中的先前输入的数据填充输入字段？

来自分类Dev

无效使用非静态数据成员进行矩阵构建

来自分类Dev

如何使用MIDASR包在MIDAS模型中使用参差不齐的边缘数据进行预测？

来自分类Dev

如何使用mlr3估算数据并使用NA值进行预测？

来自分类Dev

数据透视表按日期进行预测

来自分类Dev

数据集中的最小行数，以进行准确的预测

来自分类Dev

使用glm预测新数据

来自分类Dev

使用 TensorFlow 预测新数据

来自分类Dev

在测试数据上使用LARS模型进行预测时出现错误消息

来自分类Dev

使用机器学习根据传感器数据进行故障预测

Related 相关文章

文章