我不是ML方面的专家,最近我开始逐一实现ML算法。在成功实现逻辑回归之后,我陷入了一个问题:如何在给定数据集的情况下选择多项式模型?根据输入特征(例如 m 样本数据集的 n 特征),我们有不同的多项式组合,但是有没有办法选择最合适的多项式?我脑子里有两个想法,我不确定它们是否正确。如果科学家使用任何特定的算法或过程,请告知我。谢谢。
- 就像我们运行不同的多项式,看看哪个多项式将导致最低的成本? (我感觉这将是一个漫长而痛苦的过程)
- 绘制数据并进行可视化,以查看哪种多项式假设最适合(再次,对于多维数据,视觉绘制将非常困难)