我有一个数据集,如下所示:
数据描述:
源目标:商店名称。总共约1000个组合
日期:每日数据,每个Source-Dest组合都有22个月的数据
库存数量,销售订单:很少有数字列会影响目标变量-发货数量
调度数量:目标变量要提前14天进行预测-从9月1日到9月14日(在此示例中)
我已经尝试过:
-
转换日期后的
- RF和XGBoost等传统ML方法 列日期功能,例如年,月,年中的星期, 月份,周末标志等
- 时间序列-ARIMA和先知(FB 包)。但是这些是不可扩展的。因此,对于1000个组合 Source-Dest我必须使用1000种不同的模型 在业务场景中可行
我阅读了有关具有不同数值x变量以预测y(Ref link)的LSTM。但是,我的数据具有数字x变量(例如,数量)以及分类x变量(例如,〜1000个商店组合)。我该如何进行呢?如何为此准备数据集?我听说过编码器-解码器网络,但是不确定如何在这种类型的数据中实现。