用NN进行集群识别

我有一个数据框,其中包含我想用于训练神经网络的数百万个粒子的坐标。这些粒子构成了已经被识别和标记的单个簇。意味着已经将每个粒子都分配给了它的正确簇(这个分配是通过密度估计来完成的,但出于我的目的,它并不重要)。 现在的挑战是建立一个网络,在从海量数据中学习后进行聚类。数据框中还有一些其他功能,例如簇大小,簇中的粒子数量等。

因为这不是分类问题,但更多地是对集群的识别挑战,我应该使用哪种神经网络?我在构建此网络时也遇到了问题:例如,一个cnn将小麦分类为图片中的狗或猫,输出显然是二进制的。因此最后一层也仅由两个表示概率为1或0的输出组成。但是,当我要识别聚类时如何实现最后一层呢?

在研究过程中,我听说了自组织地图。这些网络能胜任吗?

谢谢

xzxlaoqi 回答:用NN进行集群识别

如果要将聚类视为分类问题,则可以尝试训练网络预测两个点是属于同一聚类还是属于不同聚类

尽管这并不能最终解决您的问题-要对数据进行聚类,该标签需要具有传递性(可能不会),并且您必须标记n²对,这很昂贵。

此外,由于您的群集是基于密度的,因此您的网络可能需要了解更多数据点,以判断应该连接哪些数据点...

,
  

这些粒子建立了已经被识别的单个簇   并贴上标签;意味着每个粒子已经分配给它   正确的群集(此分配是通过密度估算完成的,但   就我的目的而言无关紧要)。   现在的挑战是建立一个网络来进行集群   从海量数据中学习之后。

在我看来,声音听起来很像是分类问题。图片本身可以在其图片空间(例如,尺寸为width * height * RGB的矢量空间)中建立簇。

  

因为这不是分类问题,而是更多的标识   集群挑战我应该使用哪种神经网络?

您有坐标数据,有标签。从简单的完全连接的单层/多层感知器(即香草NN)开始,其输出与簇数和softmax激活功能一样多。

互联网上有大量的keras之类的深度学习库博客和教程。

本文链接:https://www.f2er.com/3159562.html

大家都在问