搜索

搜索

线性回归测试数据违反训练数据。请解释我哪里出错了

debugcn 发表于 Dev

12

硕士END

这是数据集的一部分，该数据集包含1000个不同位置的房屋租金定价条目。

训练模型后，如果我发送与训练数据相同的训练数据，则结果不正确。这怎么可能？

X_loc = df[{'area','rooms','location'}]

y_loc = df[:]['price']

X_train, X_test, y_train, y_test = train_test_split(X_loc, y_loc, test_size = 1/3, random_state = 0)

regressor = LinearRegression()

regressor.fit(X_train, y_train)

y_pred = regressor.predict(X_train[0:1])

数据集：

    price rooms  area location

0 0 22000   3    1339   140

1 1 45000   3    1580    72

3 3 72000   3    2310    72

4 4 40000   3    1800    41

5 5 35000   3    2100    57

预期输出（y_pred）应该为220000，但显示为290000，它如何违反已经受过训练的输入？

Awadelrahman MA艾哈迈德

您所观察到的正是所谓的“训练误差”。机器学习模型旨在找到“最佳”拟合，从而最大程度地减少“总误差”（即，针对所有数据点而不是每个数据点）。22000与29000的差距不是很大，尽管它不是确切的数字。这是因为线性回归尝试将数据中的所有变化压缩为一条直线。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-2

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

如何将训练数据集上的线性回归结果应用于测试数据集？

来自分类Dev

如何将训练数据集上的线性回归结果应用到测试数据集上？

来自分类Dev

无法训练或测试数据

来自分类Dev

绘制scikit-learn学习数据集训练和测试数据时出错

来自分类Dev

训练和测试数据的偏差图

来自分类Dev

拆分训练和测试数据

来自分类Dev

我可以对训练和测试数据使用假设测试吗？

来自分类Dev

Sklearn训练数据和测试数据的大小不同

来自分类Dev

在共享任务中使用训练数据和测试数据

来自分类Dev

我哪里出错了？

来自分类Dev

我是否必须对训练和测试数据集分别进行一次热编码？

来自分类Dev

我如何标记卷积神经网络的训练和测试数据？

来自分类Dev

在Tensorflow中读取大型训练/验证/测试数据集

来自分类Dev

训练期间输出测试数据的准确性

来自分类Dev

使用插入符号预处理训练和测试数据

来自分类Dev

Tidymodels：根据训练和测试数据创建rsplit对象

来自分类Dev

在Tensorflow中读取大型训练/验证/测试数据集

来自分类Dev

Python-Scikit。使用SVM训练和测试数据

来自分类Dev

机器学习中的训练和测试数据

来自分类Dev

请参考测试数据中的基本模块-Odoo 11

来自分类Dev

让我的主干视图加载测试数据？

来自分类Dev

我从mysql数据库中提取值时哪里出错了？

来自分类Dev

嗨，我对此有疑问，请告诉我我哪里出错了

来自分类Dev

我哪里出错了 - JAVASCRIPT

来自分类Dev

即使训练和测试数据相同，分类器在每次训练时也会给出不同的结果

来自分类Dev

使用R将数据按准则随机分为训练和测试数据集

来自分类Dev

R：如何将测试数据映射到由训练数据创建的lsa空间

来自分类Dev

scikit学习中的高斯过程：训练数据性能好，测试数据性能差

来自分类Dev

R：如何将测试数据映射到由训练数据创建的lsa空间

Related 相关文章

文章

热门标签

归档