问题:将标签的过去用作特征是否正常/通常/专业? 尽管这是一个基本问题,但我找不到任何可靠的结果。
我对ml很陌生。我尝试预测某个月的可用数据,即每月的可用时间,因此是一个时间序列,但是我没有将其用作时间序列。
这是一个分类模型,我可以预测该时间序列中所选月份的标签列。所选标签月份之前的前几个月现在是问题的重点。
我不想仅仅因为过去几个月成为“标签”而放弃。我知道标签的过去,为什么不也将其视为功能?
将标签时间序列的过去标签添加到要素中时,我的预测当然要好得多。这是合乎逻辑的,因为标签通常在一个月到另一个月之间变化不大,因此如果将标签的过去作为数据来提供,则可以很好地预测。不使用这样的“过去标签”作为特征会很奇怪,因为任何简单的时间序列回归都将比ml模型更好。
示例:假设我预测了一个人的智商测试结果,并且使用她过去的智商测试结果作为其他正常的“非标签”特征(如年龄,教育程度)的特征。除了正常的“非标签”功能外,我还使用一年中“过去的标签” 的前11个月作为功能。我预计第12个月的标签。 如果将标签的过去添加到功能中,则预测第12个月的标签会更好-显然。这是因为历史标签(如果有的话)当然比年龄和教育程度等普通栏更好地指示了最终结果。