用NN进行集群识别

2024-04-25 • 问答

我有一个数据框，其中包含我想用于训练神经网络的数百万个粒子的坐标。这些粒子构成了已经被识别和标记的单个簇。意味着已经将每个粒子都分配给了它的正确簇（这个分配是通过密度估计来完成的，但出于我的目的，它并不重要）。现在的挑战是建立一个网络，在从海量数据中学习后进行聚类。数据框中还有一些其他功能，例如簇大小，簇中的粒子数量等。

因为这不是分类问题，但更多地是对集群的识别挑战，我应该使用哪种神经网络？我在构建此网络时也遇到了问题：例如，一个cnn将小麦分类为图片中的狗或猫，输出显然是二进制的。因此最后一层也仅由两个表示概率为1或0的输出组成。但是，当我要识别聚类时如何实现最后一层呢？

在研究过程中，我听说了自组织地图。这些网络能胜任吗？

谢谢

如果要将聚类视为分类问题，则可以尝试训练网络预测两个点是属于同一聚类还是属于不同聚类。

尽管这并不能最终解决您的问题-要对数据进行聚类，该标签需要具有传递性（可能不会），并且您必须标记n²对，这很昂贵。

此外，由于您的群集是基于密度的，因此您的网络可能需要了解更多数据点，以判断应该连接哪些数据点...

这些粒子建立了已经被识别的单个簇并贴上标签；意味着每个粒子已经分配给它正确的群集（此分配是通过密度估算完成的，但就我的目的而言无关紧要）。现在的挑战是建立一个网络来进行集群从海量数据中学习之后。

在我看来，声音听起来很像是分类问题。图片本身可以在其图片空间（例如，尺寸为width * height * RGB的矢量空间）中建立簇。

因为这不是分类问题，而是更多的标识集群挑战我应该使用哪种神经网络？

您有坐标数据，有标签。从简单的完全连接的单层/多层感知器（即香草NN）开始，其输出与簇数和softmax激活功能一样多。

互联网上有大量的keras之类的深度学习库博客和教程。

用NN进行集群识别

xzxlaoqi 回答：用NN进行集群识别

大家都在问