我有一个Spark ML管道,需要将其部署为MLeap序列化模型。
模型运行良好,但与预测一起,我还想输出第二个字段,即预测中的错误。
错误已预先计算并存储在CSV中(不是模型)。 CSV具有与模型完全相同的输入参数以及错误字段。
我该怎么做? Spark ML中是否存在“ CSVLookup”或“ TableLookup”管道阶段,我可以在其中发送CSV并可以基于一些输入参数实时查找值并将其序列化为MLeap捆绑包?
我有一个Spark ML管道,需要将其部署为MLeap序列化模型。
模型运行良好,但与预测一起,我还想输出第二个字段,即预测中的错误。
错误已预先计算并存储在CSV中(不是模型)。 CSV具有与模型完全相同的输入参数以及错误字段。
我该怎么做? Spark ML中是否存在“ CSVLookup”或“ TableLookup”管道阶段,我可以在其中发送CSV并可以基于一些输入参数实时查找值并将其序列化为MLeap捆绑包?