在处理 ANN 的回归问题时，如何为数据集的离散值编码变量？

2024-05-17 • 问答

我将使用人工神经网络来预测输出值。

有7个输入变量，都是数值类。它们有不同的范围。

只有一个输出，也是数值类。训练集示例：

input1<-runif(150,min=0.3,max=1.8)
input2<-runif(150,min=0.65,max=0.85)
input3<-runif(150,min=1.8,max=2)
input4<-runif(150,min=0,max=1.6)
input5<-runif(150,min=2.8,max=2.862)
input6<-runif(150,max=2.862)
input7<-runif(150,min=-0.06,max=1.85)

output<-runif(150,min=0.55,max=0.75)

我的目标：将数据离散化应用于属性，以便 ANN 能够给出更准确的预测。

我目前完成的工作：

使用 EqualWidth 方法成功地将每个属性离散为 10 个级别（Arities 或 bins）。
已使用我自己的方法将离散值的级别编码为数字，以便应用于人工神经网络。 List of encoded level
已经运行了 ANN，并实现了预测，但偏差很大。 Prediction

我的问题：

附加我自己的编码方法，它的缺点是什么？ my own method
他们是否还有其他高级方法来对关卡进行编码？实际上，我发现了一些有关处理分类问题的相关方法，例如一种热编码、标签编码、序数编码、赫尔默特编码、二进制编码。我不能将我的方法用于其中任何一个，而且我也很难将它们应用到我的工作中。
他们有什么论文可以推荐给我，特别是关于我工作中数据离散化的论文吗？

提前致谢。

在处理 ANN 的回归问题时，如何为数据集的离散值编码变量？

xiangzhou1990 回答：在处理 ANN 的回归问题时，如何为数据集的离散值编码变量？

大家都在问