如何纠正多元线性回归模型的异方差

我正在拟合具有6个预测变量(3个连续变量和3个分类变量)的多元线性回归模型。残差与拟合图表明存在异方差性,也已通过bptest()确认。

summary of sales_lm

rediduals vs. fitted plot

我还为火车数据和测试数据计算了sqrt,如下所示:

sqrt(mean(sales_train_lm_pred-sales_train$SALES)^2)

2 3533.665

 sqrt(mean(sales_test_lm_pred-sales_test$SALES)^2)

2 3556.036

我试图拟合glm()模型,但仍然无法纠正异方差。

 glm.test3<-glm(SALES~.,weights=1/sales_fitted$.resid^2,family=gaussian(link="identity"),data=sales_train)

resid vs. fitted plot for glm.test3 看起来很奇怪。 glm.test3 plot

您能帮我下一步做什么吗?

谢谢!

ip0017 回答:如何纠正多元线性回归模型的异方差

您观察到数据的异方差意味着方差不是平稳的。您可以尝试以下操作:

1)对数据集中的一个或多个变量应用具有合适的lambda的单参数Box-Cox transformation(对数转换是特例)。最佳lambda可以通过查看其对数似然函数来确定。看看MASS::boxcox

2)使用您的功能集(减少,增加,添加新变量)。

2)使用加权线性回归方法。

本文链接:https://www.f2er.com/3126962.html

大家都在问