-
K-均值不导致肘部形状
我正在尝试仅使用有关客户端的变量在<a href="https://archive.ics.uci.edu/ml/datasets/Bank+Marketing#" rel="nofollow norefe -
k如何表示算法实现颜色压缩
我在下面的链接中读到有关k表示算法的 <a href="https://github.com/jakevdp/PythonDataScienceHandbook/blob/master/n -
有没有一种方法可以使用标签将图像分类到文件夹中?
尝试根据输出的标签将我的非监督图像分类到文件夹中。我从一个.jpg图像目录开始,将它们调整为一个 -
文本聚类中的k均值失败
无法使用k均值对文本进行聚类 我已经计算了大约6000条评论的word2vec,并希望使用k均值对单词向量 -
迷你批处理K均值和顺序/在线KMeans之间的差异
我正在使用scikit-learn库sklearn.cluster尝试K-Means及其变体的示例。 minibatch K-Means聚类和在线/顺序K-Means聚类 -
K-均值聚类字母成绩
我正在从事一项工作,该工作要求在python中基本实现k-means聚类算法。我们正在使用的数据具有数字的原 -
R中的k个模式下的下标类型“列表”无效
我有一个包含8848个观测值的数据集,其中包含46个变量。在将kmodes应用于所需列时,会产生错误。 <p -
用KNN还是K-Means来减少特征的维数?
<blockquote> <h1>减少功能数量/概述每个国家/地区在给定类别中的表现。</h1> <blockquote> <ul> -
如何将轮廓分数添加到列表
我想在循环中将轮廓分数添加到列表中。 <pre><code> from sklearn.cluster import KMeans from sklearn.me -
具有带有TruncatedSVD的Kmeans的管道的变换方法所给出的形状与在TruncatedSVD的n_components上指定的形状不同
我正在尝试通过以下方式使用具有奇异值分解和K均值的降维方法对一些科学文献进行聚类 <pre class="l -
AgglomerativeClustering()。fit(Y)和zip(* pairs)python
我有功能 (X,Y)= transform_text(read_dataset(“ SMSSpamCollection”)) <pre><code>{for x,y in zip(*X.nonzero()): -
K均值算法
我已将名为“ Income_details”的csv文件导入到熊猫数据框。在缩放数据时,出现了一些错误。代码和错误 -
KMeans算法如何绘制点?
KMeans算法如何为聚类目的处理数据点的绘制? 例如,考虑具有许多功能的3个数据点。除此之外 -
在文本挖掘中对K-means进行分类
目标是创建一个计算机生成的新闻网站,以汇总来自世界各地不同新闻来源的头条新闻: 看看质 -
有没有一种方法可以将群集再次投影回箱线图中?
我将数据分为两个部分,并针对数据集进行了K均值聚类以及归一化和PCA。现在,我想将聚类的图投影回 -
R中的成对K均值
我有一个<code>dataset</code>,我想应用<code>K-means clustering</code>进行分组。但是,我只想考虑变量对。 < -
kmeans.cluster()在对句子使用词嵌入(word2vec)时给出错误“ TypeError:'float'对象不可迭代”
我正在尝试使用kmeans对句子进行聚类 但没有正确输入<code>cluster()</code>的输入类型。 我尝试将列 -
KMeans和创建树状图是否会产生相同的标签?
我正在使用一些数据来生成一些标签,以便可以对我的数据进行排序,以在有监督的学习环境中使用。 -
有没有办法使用kmeans在簇中找到高度表达的基因?
我有一个数据集,看起来像下面的图片,但更大(数千个基因): <a href="https://i.stack.imgur.com/89tw1 -
快速矿工中的k均值质心图实际上意味着什么(以外行的术语)?
有人可以向我解释Rapid Miner中k均值的质心图到底是什么意思吗? 我知道这张图将每个特征相对于聚类的 -
KMeans不会在sklearn中返回可重现的结果,即使修复random_state
以下代码测试KMeans中的多个n_clusters,并尝试通过惯性准则找到“最佳” n_clusters。但是,它是不可复制 -
聚类,Mclust(),提取聚类-R
我正在使用<code>mclust::Mclust()</code>函数对一个小的数据集进行聚类。但是,我在为每个要放入数据集中的 -
状态将R
我正在分析28个州的样本。我基于6个群集中的变量对状态进行群集。我想跟踪状态如何在十年内迁移/保 -
使用HDBSCAN检索集群的成员
所以我有一些字符串数据,需要对其进行一些操作,然后使用HDBSCAN创建集群: <pre><code>textData = train[ -
如何为木地板文件申请kmeans?
<a href="https://i.stack.imgur.com/eWATF.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/eWATF.png" alt="parquet file -
可视化聚类结果
使用k均值后,我有3个簇。 我已经在此数据集的k均值中使用了10个功能(标记)。 我了解我们无 -
消息不适合sklearn k均值收敛实现
为了在基于张量流的k-means实现中重复使用scikit-learn KMeans中实现的k-means收敛标准,我需要理解它,但是 -
找到最佳值时如何设置K的范围?
虽然KMeans算法对大型数据集进行聚类,但为了找到K的最佳值,我们可以使用以下代码片段: <pre><code -
二进制值使用哪个距离度量?
我有100个用户喜欢/不喜欢500个项目。 因此,我已经用二进制值转换了矩阵,即,如果用户u1喜欢项I1, -
在Python或C ++中为K -Means聚类/删除背景遮罩
我正在尝试使用K-Means聚类Python库对图像进行分类。但是,图像中包含黑色(蒙版)背景,在聚类之前我