使用HDBSCAN检索集群的成员

2024-05-16 • 问答

所以我有一些字符串数据，需要对其进行一些操作，然后使用HDBSCAN创建集群：

textData = train['eudexHash'].apply(lambda x: str(x))
clusterer = hdbscan.HDBSCAN(min_cluster_size=5,gen_min_span_tree=True,prediction_data=True).fit(textData.values.reshape(-1,1))

现在，当我调用聚类以使用approximate_predict进行预测时，我得到了以下结果：

>>>> hdbscan.approximate_predict(clusterer,testCase)
(array([113]),array([1.]))

很甜，看起来它正在预测新的情况，因此它认为新的字符串值对应于标签[113]。现在，如何找到该标签/存储桶/群集中的其他成员？

干杯！

shabisb1006810086 回答：使用HDBSCAN检索集群的成员

如果您想找出标签113中的哪些训练数据，那么您就可以这样做

textdata_with_label_113 = textData[clusterer.labels_ == 113]

cluster-analysis hdbscan k-means machine-learning

本文链接：https://www.f2er.com/3071864.html

使用HDBSCAN检索集群的成员

shabisb1006810086 回答：使用HDBSCAN检索集群的成员

大家都在问