线性回归测试数据违反训练数据。请解释我哪里出错了

硕士END

这是数据集的一部分,该数据集包含1000个不同位置的房屋租金定价条目。

训练模型后,如果我发送与训练数据相同的训练数据,则结果不正确。这怎么可能?

X_loc = df[{'area','rooms','location'}]

y_loc = df[:]['price']

X_train, X_test, y_train, y_test = train_test_split(X_loc, y_loc, test_size = 1/3, random_state = 0)

regressor = LinearRegression()

regressor.fit(X_train, y_train)

y_pred = regressor.predict(X_train[0:1])

数据集:

    price rooms  area location

0 0 22000   3    1339   140

1 1 45000   3    1580    72

3 3 72000   3    2310    72

4 4 40000   3    1800    41

5 5 35000   3    2100    57

预期输出(y_pred)应该为220000,但显示为290000,它如何违反已经受过训练的输入?

Awadelrahman MA艾哈迈德

您所观察到的正是所谓的“训练误差”。机器学习模型旨在找到“最佳”拟合,从而最大程度地减少“总误差”(即,针对所有数据点而不是每个数据点)。22000与29000的差距不是很大,尽管它不是确切的数字。这是因为线性回归尝试将数据中的所有变化压缩为一条直线。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何将训练数据集上的线性回归结果应用于测试数据集?

来自分类Dev

如何将训练数据集上的线性回归结果应用到测试数据集上?

来自分类Dev

无法训练或测试数据

来自分类Dev

绘制scikit-learn学习数据集训练和测试数据时出错

来自分类Dev

训练和测试数据的偏差图

来自分类Dev

拆分训练和测试数据

来自分类Dev

我可以对训练和测试数据使用假设测试吗?

来自分类Dev

Sklearn训练数据和测试数据的大小不同

来自分类Dev

在共享任务中使用训练数据和测试数据

来自分类Dev

我哪里出错了?

来自分类Dev

我是否必须对训练和测试数据集分别进行一次热编码?

来自分类Dev

我如何标记卷积神经网络的训练和测试数据?

来自分类Dev

在Tensorflow中读取大型训练/验证/测试数据集

来自分类Dev

训练期间输出测试数据的准确性

来自分类Dev

使用插入符号预处理训练和测试数据

来自分类Dev

Tidymodels:根据训练和测试数据创建rsplit对象

来自分类Dev

在Tensorflow中读取大型训练/验证/测试数据集

来自分类Dev

Python-Scikit。使用SVM训练和测试数据

来自分类Dev

机器学习中的训练和测试数据

来自分类Dev

请参考测试数据中的基本模块-Odoo 11

来自分类Dev

让我的主干视图加载测试数据?

来自分类Dev

我从mysql数据库中提取值时哪里出错了?

来自分类Dev

嗨,我对此有疑问,请告诉我我哪里出错了

来自分类Dev

我哪里出错了 - JAVASCRIPT

来自分类Dev

即使训练和测试数据相同,分类器在每次训练时也会给出不同的结果

来自分类Dev

使用R将数据按准则随机分为训练和测试数据集

来自分类Dev

R:如何将测试数据映射到由训练数据创建的lsa空间

来自分类Dev

scikit学习中的高斯过程:训练数据性能好,测试数据性能差

来自分类Dev

R:如何将测试数据映射到由训练数据创建的lsa空间

Related 相关文章

  1. 1

    如何将训练数据集上的线性回归结果应用于测试数据集?

  2. 2

    如何将训练数据集上的线性回归结果应用到测试数据集上?

  3. 3

    无法训练或测试数据

  4. 4

    绘制scikit-learn学习数据集训练和测试数据时出错

  5. 5

    训练和测试数据的偏差图

  6. 6

    拆分训练和测试数据

  7. 7

    我可以对训练和测试数据使用假设测试吗?

  8. 8

    Sklearn训练数据和测试数据的大小不同

  9. 9

    在共享任务中使用训练数据和测试数据

  10. 10

    我哪里出错了?

  11. 11

    我是否必须对训练和测试数据集分别进行一次热编码?

  12. 12

    我如何标记卷积神经网络的训练和测试数据?

  13. 13

    在Tensorflow中读取大型训练/验证/测试数据集

  14. 14

    训练期间输出测试数据的准确性

  15. 15

    使用插入符号预处理训练和测试数据

  16. 16

    Tidymodels:根据训练和测试数据创建rsplit对象

  17. 17

    在Tensorflow中读取大型训练/验证/测试数据集

  18. 18

    Python-Scikit。使用SVM训练和测试数据

  19. 19

    机器学习中的训练和测试数据

  20. 20

    请参考测试数据中的基本模块-Odoo 11

  21. 21

    让我的主干视图加载测试数据?

  22. 22

    我从mysql数据库中提取值时哪里出错了?

  23. 23

    嗨,我对此有疑问,请告诉我我哪里出错了

  24. 24

    我哪里出错了 - JAVASCRIPT

  25. 25

    即使训练和测试数据相同,分类器在每次训练时也会给出不同的结果

  26. 26

    使用R将数据按准则随机分为训练和测试数据集

  27. 27

    R:如何将测试数据映射到由训练数据创建的lsa空间

  28. 28

    scikit学习中的高斯过程:训练数据性能好,测试数据性能差

  29. 29

    R:如何将测试数据映射到由训练数据创建的lsa空间

热门标签

归档