cosine-similarity

列表中每个张量之间的Tensorflow余弦相似度

我有2个带有张量的列表（数组），想计算两个列表之间张量的余弦相似度。并获得具有相似性的输出列

前端之家
2022-08-15 • 问答
Jenson-Shannon距离是否比余弦距离更好，以比较由LDA主题向量表示的文档之间的相似性/相异性？

我遇到了一种称为<a href="https://en.wikipedia.org/wiki/Jensen%E2%80%93Shannon_divergence" rel="nofollow noreferrer">Jensen-Shanno

前端之家
2022-08-15 • 问答
我正在计算产品功能的余弦相似度，但想保存输出，以免重新计算

我正在建立产品特征的余弦相似度索引，并且由于特征空间很大，因此我想在变换特征后存储结果，这

前端之家
2022-08-15 • 问答
有效计算余弦相似度之和

我正在尝试有效地计算余弦相似度之和，但是我目前的方法相当慢。考虑到我有三个向量<code>v_1</

前端之家
2022-08-15 • 问答
如何在3000-4000字的庞大文档中进行语言表示以进行基于查询的检索？

我正在尝试进行语义搜索，以从非结构化法语文档的数据集中检索相似的文档。 <ul> <li>这些文档未

前端之家
2022-08-15 • 问答
针对许多文档计算文本相似度

我正在尝试针对其他搜索字词集合计算搜索字词<strong> A </strong>的文本相似度，例如“如何制作鸡”。为

前端之家
2022-08-14 • 问答
计算组内的余弦相似度

我有一个包含以下行的数据框。我的目标是计算同一类别中每一行与每一行的余弦相似度，这样我最终

前端之家
2022-08-13 • 问答
为每个内容创建前10条推荐建议的数据框

我从<a href="https://towardsdatascience.com/how-to-build-from-scratch-a-content-based-movie-recommender-with-natural-language-processin

前端之家
2022-08-13 • 问答
在SVD和余弦相似度数据帧上训练模型时，对于随机森林中用于预测的新数据集的数据馈送格式应该是什么

我有用于多类分类的文本数据。我完成了以下所有处理流程： <ol> <li>令牌化</li> <li>下壳体</li> <li>

前端之家
2022-08-13 • 问答
余弦相似度预处理任务

我最近开始使用NLP。作为余弦相似度计算的一部分，我必须完成以下任务： <pre><code># Convert the sentenc

前端之家
2022-08-13 • 问答
实现TF * IDF和余弦相似度

任何人都知道，如何实现<strong> TF * IDF和余弦相似度</strong>算法来搜索文档？爆炸功能和字符串替换后

前端之家
2022-08-13 • 问答
句子向量和图像向量之间的余弦相似度

我很困惑要理解句子向量和图像向量之间的余弦相似度。是否有参考文献供我阅读，或者有人可以解释

前端之家
2022-08-13 • 问答
TensorFlow：CosineDifference ObjFunc在整个训练过程中保持不变

以下示例是我正在处理的内容的简化版本。我正在尝试找到一个最小化余弦距离的神经网络。我实现自

前端之家
2022-08-13 • 问答
如何在语义上比较两个句子？

我正在尝试为大学构建一个应用程序，以便学生可以在其中进行考试但我遇到了文章问题，我无法比较

前端之家
2022-08-13 • 问答
如何在某些条件下使用额外的权重实现TF-IDF评分

我目前有一个tf-idf系统用于评分，并且我使用余弦相似度进行搜索。我想添加额外的权重，考虑到给定

前端之家
2022-08-13 • 问答
具有大尺寸矩阵的矩阵到矢量的余弦距离？

示例代码： <pre><code> import numpy as np from scipy.spatial import distance face_models = np.random.randn(1000000,

前端之家
2022-08-12 • 问答
具有Kmeans及其kmeans ++初始化和余弦距离作为相似性度量的R包？

目前，我正在尝试找到一个可以处理kmeans ++初始化和余弦距离作为相似度的Kmeans的程序包。我发现clustern

前端之家
2022-08-12 • 问答
伯特针对语义相似性进行了微调

我想应用微调的Bert来计算句子之间的语义相似度。我搜索了很多网站，但是我几乎没有在下游找到它。

前端之家
2022-08-11 • 问答
使用Count Vectorizer获得1 x N相似矩阵而不是N x N

因此，我尝试创建尺寸为60000 x 60000的巨大数据集的相似性矩阵，无法将其存储在偶数25gb的ram中，因此我

前端之家
2022-08-10 • 问答
如何计算测试文档和培训文档之间的相似度

我正在尝试计算测试文档和培训文档之间的相似度并标记它们。这是代码，但是不起作用。如果有人可

前端之家
2022-08-09 • 问答
如何聚合多种模式的文本特征（例如标题，关键字，页面正文）的向量空间表示形式以进行语义相似性搜索？

<h1>简介</h1> 我正在基于从<a href="https://tfhub.dev/google/universal-sentence-encoder/4" rel="nofollow noreferrer">Universal Se

前端之家
2022-08-09 • 问答
是否有针对不同技术单词的经过预训练的单词矢量？

我想比较两个不同的技术词的相似性<br/> 例如 <pre><code>from gensim.models import KeyedVectors model = Keye

前端之家
2022-08-08 • 问答
如何找到包含百万个文档的文档分类中的异常值？

我有数百万个文档，它们属于不同的类别（100个类别）。我想在每个类中找到异常文档（不属于该类，

前端之家
2022-08-07 • 问答
计算矩阵中的所有余弦相似度

说我有一个矩阵<code>stock = {} for warehouse in warehouses: stock[warehouse] = [] for row in results: stock[wareh

前端之家
2022-08-05 • 问答
通用句子编码器可实现大文档相似度

我需要创造一种“搜索引擎”的体验：通过简短的查询（几个词），我需要在成千上万的文档集中找到

前端之家
2022-08-05 • 问答
DSL类'script_score'在查询中不存在

我正在尝试在<a href="https://www.elastic.co/guide/en/elasticsearch/reference/7.5/query-dsl-script-score-query.html#vector-functions

前端之家
2022-08-05 • 问答
有没有一种方法可以使用余弦相似度来查找BallTree或KDTree的最近邻居？

我有非常稀疏和巨大的评分数据，应该为每个会话找到前k个邻居。我需要比较近似和精确的最近邻算法

前端之家
2022-08-04 • 问答
在python

我目前正在从事一个项目，该项目使用python中的tfidf获得文档集中最相关的10个单词。但是，在相同的单

前端之家
2022-08-04 • 问答
使用Numpy和Sklearn的余弦相似度输出不同

我有以下代码。我试图找出为什么在使用numpy点乘积与sklearn余弦相似度时余弦相似度会有所不同。我认

前端之家
2022-08-03 • 问答
计算非英语文本字符串的余弦相似度

要创建一个Python脚本，该脚本可以比较两个文本字符串并确定它们的相似度。我发现进行比较的最佳方

前端之家
2022-08-03 • 问答

首页

下一页
末页