添加具有高相关性的新功能会降低ML模型的准确性

我当时正在研究Kaggle的ames房屋数据问题,遇到了一个奇怪的情况。我创建了一些相关系数分别为0.8、0.5等的变量(数字)。

但是当我在kaggle中使用这些变量+内核时,准确性下降了!我用kfolds cv检查了准确性,实际上它正在下降。

我不明白这一点,corr可以上升而准确性会下降吗?

最终准确度从0.10降至0.33(kaggle测试准确度得分)

huangyanglv 回答:添加具有高相关性的新功能会降低ML模型的准确性

暂时没有好的解决方案,如果你有好的解决方案,请发邮件至:iooj@foxmail.com
本文链接:https://www.f2er.com/3045784.html

大家都在问