在处理 ANN 的回归问题时,如何为数据集的离散值编码变量?

我将使用人工神经网络来预测输出值。

有7个输入变量,都是数值类。它们有不同的范围。

只有一个输出,也是数值类。 训练集示例:

input1<-runif(150,min=0.3,max=1.8)
input2<-runif(150,min=0.65,max=0.85)
input3<-runif(150,min=1.8,max=2)
input4<-runif(150,min=0,max=1.6)
input5<-runif(150,min=2.8,max=2.862)
input6<-runif(150,max=2.862)
input7<-runif(150,min=-0.06,max=1.85)

output<-runif(150,min=0.55,max=0.75)

我的目标:将数据离散化应用于属性,以便 ANN 能够给出更准确的预测。

我目前完成的工作:

  • 使用 EqualWidth 方法成功地将每个属性离散为 10 个级别(Arities 或 bins)。
  • 已使用我自己的方法将离散值的级别编码为数字,以便应用于人工神经网络。 List of encoded level
  • 已经运行了 ANN,并实现了预测,但偏差很大。 Prediction

我的问题:

  1. 附加我自己的编码方法,它的缺点是什么? my own method
  2. 他们是否还有其他高级方法来对关卡进行编码? 实际上,我发现了一些有关处理分类问题的相关方法,例如 一种热编码、标签编码、序数编码、赫尔默特编码、二进制编码。我不能 将我的方法用于其中任何一个,而且我也很难将它们应用到我的工作中。
  3. 他们有什么论文可以推荐给我,特别是关于我工作中数据离散化的论文吗?

提前致谢。

xiangzhou1990 回答:在处理 ANN 的回归问题时,如何为数据集的离散值编码变量?

暂时没有好的解决方案,如果你有好的解决方案,请发邮件至:iooj@foxmail.com
本文链接:https://www.f2er.com/1159747.html

大家都在问