-
使用K-Means群集时,如果群集中只有一个数据点,该怎么办?
我正在使用等分的K均值,它使用k = 2的k均值,并且在1个群集中仅遇到1个数据点。这是否意味着K-Means进 -
是否可以根据R中的k均值聚类计算密度图?
我对我的数据进行了聚类分析并获得了结果。我想在密度图中绘制k-means = 3的结果,并计算这三个组之间 -
在k均值聚类矢量量化过程中不了解这些RuntimeWarnings
我正在尝试实现K-Means聚类算法,但是我经常遇到以下错误 <pre class="lang-none prettyprint-override"><code>C:\Us -
如何确定k均值的起点? (蟒蛇)
作为我要进行数据收集工作的一部分,请使用不同的方法对其进行采样,然后再次完成(以使所有数据 -
sklearn.cluster.KMeans之后如何获得初始化点
从sklearn.cluster执行均值后,如何知道用于均值的初始化点? 对于我的每个集群,我需要返回所使 -
k-means聚类的性能非常差,如何改进?
我正在使用pyspark.ml通过k-means进行聚类。数据大约有500万行和100个要素,这些都是分类的。我使用一站式 -
K模式聚类采样
在将k个模式应用于数据集后,我想对集群进行采样。到目前为止,我已经构建了以下代码: <pre><code -
K-Means ++之后的子分类最好使用随机森林吗?
在我的工作中,我尝试建立数据集的<strong>子分类</strong>,因此该想法是在当前宏类中检测子类。为了获 -
ggplot中的Kmean聚类
我正在使用K-均值算法。在<code>R</code>中以分隔变量。我想在我能够管理的<code>ggplot</code>女巫中绘制结果 -
在R
我正在使用一个名为productQuality1.1的CSV数据集,其中包含5列,其中Median是我用来确定聚类结果的产品质 -
K均值结果索引在第二轮中有所不同
我正在对某些统计数据运行K-Means。我的矩阵大小为[192x31634]。 K-Means表现出色,并创建了7个质心,这是 -
Spark:如何在StreamingKMeans中标记火车数据
我在使用Apache Spark ML模块的StreamingKMeans中标记火车数据时遇到问题。 在文档(<a href="https://spark.ap -
如何找到一维数组的弯头?
我有以下几列的数据框;日期和湿度: <pre><code>data = {'Date':['09:00:00', '10:00:00', ' -
K表示二项分布的聚类
我正在尝试使用kmeans聚类来检测由bernoulli过程生成的二维网格中的雷区和自由区。。。但是,质心分配 -
这种kmeans聚类的最佳k是多少? (弯头图)
我正在尝试kmeans来寻找在首尔地铁站附近开设咖啡店的最佳地点。 包括的功能是: <ol> <li>特 -
具有Kmeans及其kmeans ++初始化和余弦距离作为相似性度量的R包?
目前,我正在尝试找到一个可以处理kmeans ++初始化和余弦距离作为相似度的Kmeans的程序包。我发现clustern -
Matlab或python中的聚类分析-三维数据的k均值聚类
我有3维数据。因此,对于705个频率,我有24 * 2数据。 24行代表小时,而列代表均值和方差系数。此24 * 2 -
为什么sklearn.metrics.silhouette_score对于稀疏矩阵输入这么慢?
我正在尝试使用<code>sklearn.cluster.KMeans</code>将一堆34个元素的向量(〜200,000)聚类,并使用<code>sklearn.metr -
K值表示循环辅助
在下面的代码中,当尝试重新运行代码时,是否会像这样使用for循环? <pre class="lang-py prettyprint-overri -
在CountVectorizer中删除单词的单次出现
我正在使用<code> /api/pdf_from_html: post: tags: - PDF description: Create PDF from html produces: - appli -
如何在k均值聚类算法中选择适合可视化的列?
我正在尝试理解csv文件中列的选择,应将其应用于k-means。 在下面的链接中,只将年收入和支出得分作为 -
为什么在mahout k-means运行期间发生错误检查-c的参数?
当我使用Linux的命令行在mahout上运行k-means时,例如<em> $ mahout kmeans -i / input path / tfidf-vectors -o / path to outpu -
确定最佳簇数
我正在使用此代码查找kmeans簇的弯头值。 <pre><code>Sum_of_squared_distances = [] K = range(1, 100) for k in K: km -
在研究集群的sd时,有时会返回NA,有时会不返回
我使用kmeans进行聚类分析。 然后,我调查每个群集内的标准偏差(sd)并获得最大值。 如果我多 -
如何将scikit学习集群应用于大型数据集?
我是scikit Learn的新手,我正尝试对该数据集进行聚类以进行无监督聚类,然后根据<a href="https://i.stack.imgu -
使用aws sagemaker聚类稀疏矩阵
有没有人有将scipy.sparse_matrix()写入protobuf sparse_tensor并在AWS Sagemaker上使用该sparse_tensor进行聚类的经验 -
基于SPSS和R中的3个变量的聚类组
我目前正在尝试了解聚类分析(使用SPSS和R)。读了太多有关它的文章后,我进一步困惑了使用哪种聚类 -
如何将数据帧的字符串值映射到某个数字以绘制簇?
我想通过我知道的唯一方法来绘制数据集的簇,即将字符串映射到某个整数值。喜欢 <pre><code>data_mapp -
带有scikit-learn的K-Means算法:初始化质心时的问题
嗨,我正在尝试使用scikit-learn用k-means算法构造一个简单的示例。在我的示例中,我想使用预定义的群集 -
使用kmeans运行管道时,在绘制时会中断
我正在尝试使用kmeans运行管道,但是它破坏了我已经尝试单独进行的管道,但仍然无法正常工作。 <p