我有一个InputData
课,如下所示
public class InputData
{
public string[] TextFields { get; set; }
public float[] NumericFields { get; set; }
}
构建管道时,我可以用1行代码轻松将NumericFields
转换为数字特征
var numFeatures = MlContext.Transforms.concatenate("NumFeatures",nameof(InputData.NumericFields));
但是我找不到一种热编码TextFields
根据https://docs.microsoft.com/en-us/dotnet/api/microsoft.ml.categoricalcatalog.onehotencoding的示例,每个文本字段都需要具有自己的属性,然后可以添加为
MlContext.Transforms.Categorical.OneHotEncoding("TextField1","TextField2" ....);
有没有更优雅的方法可以快速对文本字段数组进行OneHotEncoding?
谢谢