我正在尝试使用三个自变量拟合线性回归模型,并使用sklearn计算均方误差,但我似乎无法正确解决。
我的数据是波士顿住房,三个独立变量如下:1. CRIM(城镇的人均犯罪率)2. RM(每个住宅的平均房间数)3. PTRATIO(城镇的师生比率)
合适型号:
import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
import sklearn
lm = LinearRegression()
lm.fit(X[['CRIM']['RM'], ['PTRATIO']], boston_df.PRICE)
计算均方误差
from sklearn.metrics import mean_squared_error
y_true = ['CRIM', 'RM', 'PTRATIO']
y_pred = ['PRICE']
mean_squared_error(y_true, y_pred)
任何建议或提示,不胜感激!
尝试X[['CRIM', 'RM', 'PRTATIO']]
代替X[['CRIM']['RM'], ['PTRATIO']]
拟合模型
为了进行预测,您需要比较以下两个向量:
y_true = boston_df.PRICE
y_pred = lm.predict(X[['CRIM', 'RM', 'PRTATIO']])
mean_squared_error(y_true, y_pred)
基本上,您y_pred
应该是模型中的预测值,lm
在这种情况下就是这样。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句