k-means

使用K-Means群集时，如果群集中只有一个数据点，该怎么办？

我正在使用等分的K均值，它使用k = 2的k均值，并且在1个群集中仅遇到1个数据点。这是否意味着K-Means进

前端之家
2022-08-13 • 问答
是否可以根据R中的k均值聚类计算密度图？

我对我的数据进行了聚类分析并获得了结果。我想在密度图中绘制k-means = 3的结果，并计算这三个组之间

前端之家
2022-08-13 • 问答
在k均值聚类矢量量化过程中不了解这些RuntimeWarnings

我正在尝试实现K-Means聚类算法，但是我经常遇到以下错误 <pre class="lang-none prettyprint-override"><code>C:\Us

前端之家
2022-08-13 • 问答
如何确定k均值的起点？（蟒蛇）

作为我要进行数据收集工作的一部分，请使用不同的方法对其进行采样，然后再次完成（以使所有数据

前端之家
2022-08-13 • 问答
sklearn.cluster.KMeans之后如何获得初始化点

从sklearn.cluster执行均值后，如何知道用于均值的初始化点？对于我的每个集群，我需要返回所使

前端之家
2022-08-13 • 问答
k-means聚类的性能非常差，如何改进？

我正在使用pyspark.ml通过k-means进行聚类。数据大约有500万行和100个要素，这些都是分类的。我使用一站式

前端之家
2022-08-12 • 问答
K模式聚类采样

在将k个模式应用于数据集后，我想对集群进行采样。到目前为止，我已经构建了以下代码： <pre><code

前端之家
2022-08-12 • 问答
K-Means ++之后的子分类最好使用随机森林吗？

在我的工作中，我尝试建立数据集的<strong>子分类</strong>，因此该想法是在当前宏类中检测子类。为了获

前端之家
2022-08-12 • 问答
ggplot中的Kmean聚类

我正在使用K-均值算法。在<code>R</code>中以分隔变量。我想在我能够管理的<code>ggplot</code>女巫中绘制结果

前端之家
2022-08-12 • 问答
在R

我正在使用一个名为productQuality1.1的CSV数据集，其中包含5列，其中Median是我用来确定聚类结果的产品质

前端之家
2022-08-12 • 问答
K均值结果索引在第二轮中有所不同

我正在对某些统计数据运行K-Means。我的矩阵大小为[192x31634]。 K-Means表现出色，并创建了7个质心，这是

前端之家
2022-08-12 • 问答
Spark：如何在StreamingKMeans中标记火车数据

我在使用Apache Spark ML模块的StreamingKMeans中标记火车数据时遇到问题。在文档（<a href="https://spark.ap

前端之家
2022-08-12 • 问答
如何找到一维数组的弯头？

我有以下几列的数据框；日期和湿度： <pre><code>data = {'Date':['09:00:00', '10:00:00', '

前端之家
2022-08-12 • 问答
K表示二项分布的聚类

我正在尝试使用kmeans聚类来检测由bernoulli过程生成的二维网格中的雷区和自由区。。。但是，质心分配

前端之家
2022-08-12 • 问答
这种kmeans聚类的最佳k是多少？（弯头图）

我正在尝试kmeans来寻找在首尔地铁站附近开设咖啡店的最佳地点。包括的功能是： <ol> <li>特

前端之家
2022-08-12 • 问答
具有Kmeans及其kmeans ++初始化和余弦距离作为相似性度量的R包？

目前，我正在尝试找到一个可以处理kmeans ++初始化和余弦距离作为相似度的Kmeans的程序包。我发现clustern

前端之家
2022-08-12 • 问答
Matlab或python中的聚类分析-三维数据的k均值聚类

我有3维数据。因此，对于705个频率，我有24 * 2数据。 24行代表小时，而列代表均值和方差系数。此24 * 2

前端之家
2022-08-12 • 问答
为什么sklearn.metrics.silhouette_score对于稀疏矩阵输入这么慢？

我正在尝试使用<code>sklearn.cluster.KMeans</code>将一堆34个元素的向量（〜200,000）聚类，并使用<code>sklearn.metr

前端之家
2022-08-11 • 问答
K值表示循环辅助

在下面的代码中，当尝试重新运行代码时，是否会像这样使用for循环？ <pre class="lang-py prettyprint-overri

前端之家
2022-08-11 • 问答
在CountVectorizer中删除单词的单次出现

我正在使用<code> /api/pdf_from_html: post: tags: - PDF description: Create PDF from html produces: - appli

前端之家
2022-08-11 • 问答
如何在k均值聚类算法中选择适合可视化的列？

我正在尝试理解csv文件中列的选择，应将其应用于k-means。在下面的链接中，只将年收入和支出得分作为

前端之家
2022-08-11 • 问答
为什么在mahout k-means运行期间发生错误检查-c的参数？

当我使用Linux的命令行在mahout上运行k-means时，例如<em> $ mahout kmeans -i / input path / tfidf-vectors -o / path to outpu

前端之家
2022-08-11 • 问答
确定最佳簇数

我正在使用此代码查找kmeans簇的弯头值。 <pre><code>Sum_of_squared_distances = [] K = range(1, 100) for k in K: km

前端之家
2022-08-11 • 问答
在研究集群的sd时，有时会返回NA，有时会不返回

我使用kmeans进行聚类分析。然后，我调查每个群集内的标准偏差（sd）并获得最大值。如果我多

前端之家
2022-08-11 • 问答
如何将scikit学习集群应用于大型数据集？

我是scikit Learn的新手，我正尝试对该数据集进行聚类以进行无监督聚类，然后根据<a href="https://i.stack.imgu

前端之家
2022-08-11 • 问答
使用aws sagemaker聚类稀疏矩阵

有没有人有将scipy.sparse_matrix（）写入protobuf sparse_tensor并在AWS Sagemaker上使用该sparse_tensor进行聚类的经验

前端之家
2022-08-11 • 问答
基于SPSS和R中的3个变量的聚类组

我目前正在尝试了解聚类分析（使用SPSS和R）。读了太多有关它的文章后，我进一步困惑了使用哪种聚类

前端之家
2022-08-11 • 问答
如何将数据帧的字符串值映射到某个数字以绘制簇？

我想通过我知道的唯一方法来绘制数据集的簇，即将字符串映射到某个整数值。喜欢 <pre><code>data_mapp

前端之家
2022-08-10 • 问答
带有scikit-learn的K-Means算法：初始化质心时的问题

嗨，我正在尝试使用scikit-learn用k-means算法构造一个简单的示例。在我的示例中，我想使用预定义的群集

前端之家
2022-08-10 • 问答
使用kmeans运行管道时，在绘制时会中断

我正在尝试使用kmeans运行管道，但是它破坏了我已经尝试单独进行的管道，但仍然无法正常工作。 <p

前端之家
2022-08-10 • 问答