我正在处理有关投票行为的数据集。我必须进行OLS回归来估计分歧对流产的影响。这是我第一次玩数据。我有两个因变量。我正在使用scikit学习线性回归模型。
运行模型后,我得到: 系数值:0.118221,0.330132
实际值:32105、34157、44165、13890、53047、0.140918
预测值:0.47105,1.037624、0.471050、0.919403
平均绝对错误:0.5163281569302932
均方误差:0.47136062479402246
均方根误差:0.6865570805068013
Idk(如果这些值正确)。如何知道这些值是否正确?如果不正确,应该更改哪些参数?
以下是我的代码:
X = df[['Deviation from Partisanship','Democrat']]
Y = df['Disagreement with Party on Social Issues']
X_train,X_test,y_train,y_test = train_test_split(X,Y,test_size=0.2,random_state=0)
regressor = LinearRegression()
regressor.fit(X_train,y_train)
coeff_df = pd.DataFrame(regressor.coef_,X.columns,columns=['Coefficient'])
y_pred = regressor.predict(X_test)
df1 = pd.DataFrame({'actual': y_test,'Predicted': y_pred})
df1.head()
print('Mean Absolute Error:',metrics.mean_absolute_error(y_test,y_pred))
print('Mean Squared Error:',metrics.mean_squared_error(y_test,y_pred))
print('Root Mean Squared Error:',np.sqrt(metrics.mean_squared_error(y_test,y_pred)))