-
可视化聚类结果
使用k均值后,我有3个簇。 我已经在此数据集的k均值中使用了10个功能(标记)。 我了解我们无 -
运行SiLix时出现“ Fam错误:无法打开文件XXX”
我尝试使用SiLix执行序列聚类。但是,我总是收到有关“ Fam中的错误:无法打开文件XXX”的错误消息。 -
如何通过nlp匹配两个不同的源句子
我是NLP的初学者。我想将NLP应用于电子商务平台上的问题。我通过搜寻器对某些产品进行了大量质量检 -
找到最佳值时如何设置K的范围?
虽然KMeans算法对大型数据集进行聚类,但为了找到K的最佳值,我们可以使用以下代码片段: <pre><code -
二进制值使用哪个距离度量?
我有100个用户喜欢/不喜欢500个项目。 因此,我已经用二进制值转换了矩阵,即,如果用户u1喜欢项I1, -
如何从模型预测中获取GMM聚类信息?
我建立了一个GMM模型,并用它来进行预测。 <pre><code>bead = df['Ce140Di'] dna = df['DNA_1'] X = np. -
您如何在数据挖掘/数据科学中基于关联规则找到集群?
假设您有一个数据库 <pre><code>Transcation-ID Item_list 1 [bread, butter, milk, diaper] 2 -
如何在大数据上运行分层集群?
我想在尺寸为<code>69878 x 10</code>的“大型”矩阵上运行分层聚类,但无法做到这一点,因为在R中运行<code -
是否可以基于多个字符串功能进行聚类
我试图学习和理解聚类算法如何使用Python工作 <strong>问题:</strong> 我有一个约有5列的混合 -
同一簇和不同哈希值的可能性
在同一个集群中是否有两个项目具有不同的哈希值?有人可以用数据结构和算法来解释它吗? -
使用K-Means群集时,如果群集中只有一个数据点,该怎么办?
我正在使用等分的K均值,它使用k = 2的k均值,并且在1个群集中仅遇到1个数据点。这是否意味着K-Means进 -
是否可以根据R中的k均值聚类计算密度图?
我对我的数据进行了聚类分析并获得了结果。我想在密度图中绘制k-means = 3的结果,并计算这三个组之间 -
如何在大量向量中找到几个相似的向量?
假定大量(例如十亿个)向量(例如存储在数据库中)。所有向量均具有相同数量的数值(例如,每个 -
通过最大直径2聚类找到最佳的2中心聚类
给定欧几里得空间中的一组点,我们希望将它们划分为2个簇,以使所有簇的最大直径最小。团簇直径的 -
如何在连接受限的情况下有效地实现图像分割?
我有n〜2e6个点的数据矩阵,其中m = 3到5个变量。 我想将我的数据划分为k〜10个具有相似可变数量的簇。 -
文本表示形式:如何区分主题相似但极性相反的字符串?
我一直在对某个语料库进行聚类,并通过获取句子的<em> tf-idf </em>,从gensim模型中检查相似性权重>某个 -
如何在ggdendrogram中反转距离比例并在距离比例下添加标签?
我正在用ggdendrogram构建基于Jaccard矩阵的树状图。有没有办法将距离比例从0-1反转为1-0并使用ggdendrogram在 -
通过2个变量对许多数据集R进行聚类
我有15个数据框,它们的结构类似:(id,v1,v2) 我想要基于V1和V2对其进行聚类 来自df1的采样数 -
聚类分析与会员等级分析
我有641种儿童饮食中引入19种不同食物的那一刻的数据。我想根据人生第一年的不同饮食习惯将这些孩子 -
计算两个聚类结果的聚类精度
所以说我有两个如下的聚类结果: <pre><code>clustering = [[8, 9, 10, 11], [14, 13, 4, 7, 6, 12, 5, 15], [1, 2, 0, 3]] c -
使用与地面真实情况相同的颜色为群集着色,以实现可视化
示例:(考虑平台= MATLAB) <pre><code>Ground_Truth_Indices = [ 1, 1, 1, 2, 2, 2, 3, 3, 3]; </code></pre> 对于GT中的 -
如何在R中将相似的文本聚类
我知道在这个/不同的论坛中可能会问过类似的问题,但是我觉得我的要求是不同的。 我有2列数据框, -
R中k模式聚类的迭代次数
我一直在尝试使用NBClust库执行集群。我的数据集包含分类变量和数值变量,而我有一个热编码的分类变 -
Python中的相似性传播算法
我必须用以下内容将一组字符串聚类。经过训练过程后,“亲和力传播”算法(基于sklearn)找到了合适 -
情节聚类矩阵
我想使用以下熊猫数据框从scikit-learn的K-means中绘制聚类矩阵: <pre><code>program main !$ use omp_lib implic -
scikit-learn:随着数据集的增加,层次聚集聚类性能
scikit-learn == 0.21.2 当增加数据集时,分层聚类算法的响应时间呈指数增长。 我的数据集是文 -
在38维中未形成3D群集
基本上,我使用527 * 38(行x列)的数据集使用K均值。 我想使用K均值,并且设置了3个聚类,但无法以3D -
对R
我有一个数据集,其中包含一组适用于所有检查的问题。可以这样说 Q1。 “你玩什么运动” -
如何在点之间的最大距离和每个簇的最大点数受限制的情况下对经纬度数据进行聚类
我有一组分布在整个城市(约1000个)的经/纬度坐标。我想按照一些严格的规则用这些数据创建集群:</p -
K模式聚类采样
在将k个模式应用于数据集后,我想对集群进行采样。到目前为止,我已经构建了以下代码: <pre><code