-
列表中每个张量之间的Tensorflow余弦相似度
我有2个带有张量的列表(数组),想计算两个列表之间张量的余弦相似度。并获得具有相似性的输出列 -
Jenson-Shannon距离是否比余弦距离更好,以比较由LDA主题向量表示的文档之间的相似性/相异性?
我遇到了一种称为<a href="https://en.wikipedia.org/wiki/Jensen%E2%80%93Shannon_divergence" rel="nofollow noreferrer">Jensen-Shanno -
我正在计算产品功能的余弦相似度,但想保存输出,以免重新计算
我正在建立产品特征的余弦相似度索引,并且由于特征空间很大,因此我想在变换特征后存储结果,这 -
有效计算余弦相似度之和
我正在尝试有效地计算余弦相似度之和,但是我目前的方法相当慢。 考虑到我有三个向量<code>v_1</ -
如何在3000-4000字的庞大文档中进行语言表示以进行基于查询的检索?
我正在尝试进行语义搜索,以从非结构化法语文档的数据集中检索相似的文档。 <ul> <li>这些文档未 -
针对许多文档计算文本相似度
我正在尝试针对其他搜索字词集合计算搜索字词<strong> A </strong>的文本相似度,例如“如何制作鸡”。为 -
计算组内的余弦相似度
我有一个包含以下行的数据框。我的目标是计算同一类别中每一行与每一行的余弦相似度,这样我最终 -
为每个内容创建前10条推荐建议的数据框
我从<a href="https://towardsdatascience.com/how-to-build-from-scratch-a-content-based-movie-recommender-with-natural-language-processin -
在SVD和余弦相似度数据帧上训练模型时,对于随机森林中用于预测的新数据集的数据馈送格式应该是什么
我有用于多类分类的文本数据。 我完成了以下所有处理流程: <ol> <li>令牌化</li> <li>下壳体</li> <li> -
余弦相似度预处理任务
我最近开始使用NLP。作为余弦相似度计算的一部分,我必须完成以下任务: <pre><code># Convert the sentenc -
实现TF * IDF和余弦相似度
任何人都知道,如何实现<strong> TF * IDF和余弦相似度</strong>算法来搜索文档? 爆炸功能和字符串替换后 -
句子向量和图像向量之间的余弦相似度
我很困惑要理解句子向量和图像向量之间的余弦相似度。是否有参考文献供我阅读,或者有人可以解释 -
TensorFlow:CosineDifference ObjFunc在整个训练过程中保持不变
以下示例是我正在处理的内容的简化版本。我正在尝试找到一个最小化余弦距离的神经网络。我实现自 -
如何在语义上比较两个句子?
我正在尝试为大学构建一个应用程序,以便学生可以在其中进行考试 但我遇到了文章问题,我无法比较 -
如何在某些条件下使用额外的权重实现TF-IDF评分
我目前有一个tf-idf系统用于评分,并且我使用余弦相似度进行搜索。我想添加额外的权重,考虑到给定 -
具有大尺寸矩阵的矩阵到矢量的余弦距离?
示例代码: <pre><code> import numpy as np from scipy.spatial import distance face_models = np.random.randn(1000000, -
具有Kmeans及其kmeans ++初始化和余弦距离作为相似性度量的R包?
目前,我正在尝试找到一个可以处理kmeans ++初始化和余弦距离作为相似度的Kmeans的程序包。我发现clustern -
伯特针对语义相似性进行了微调
我想应用微调的Bert来计算句子之间的语义相似度。 我搜索了很多网站,但是我几乎没有在下游找到它。 -
使用Count Vectorizer获得1 x N相似矩阵而不是N x N
因此,我尝试创建尺寸为60000 x 60000的巨大数据集的相似性矩阵,无法将其存储在偶数25gb的ram中,因此我 -
如何计算测试文档和培训文档之间的相似度
我正在尝试计算测试文档和培训文档之间的相似度并标记它们。这是代码,但是不起作用。如果有人可 -
如何聚合多种模式的文本特征(例如标题,关键字,页面正文)的向量空间表示形式以进行语义相似性搜索?
<h1>简介</h1> 我正在基于从<a href="https://tfhub.dev/google/universal-sentence-encoder/4" rel="nofollow noreferrer">Universal Se -
是否有针对不同技术单词的经过预训练的单词矢量?
我想比较两个不同的技术词的相似性<br/> 例如 <pre><code>from gensim.models import KeyedVectors model = Keye -
如何找到包含百万个文档的文档分类中的异常值?
我有数百万个文档,它们属于不同的类别(100个类别)。我想在每个类中找到异常文档(不属于该类, -
计算矩阵中的所有余弦相似度
说我有一个矩阵<code>stock = {} for warehouse in warehouses: stock[warehouse] = [] for row in results: stock[wareh -
通用句子编码器可实现大文档相似度
我需要创造一种“搜索引擎”的体验:通过简短的查询(几个词),我需要在成千上万的文档集中找到 -
DSL类'script_score'在查询中不存在
我正在尝试在<a href="https://www.elastic.co/guide/en/elasticsearch/reference/7.5/query-dsl-script-score-query.html#vector-functions -
有没有一种方法可以使用余弦相似度来查找BallTree或KDTree的最近邻居?
我有非常稀疏和巨大的评分数据,应该为每个会话找到前k个邻居。我需要比较近似和精确的最近邻算法 -
在python
我目前正在从事一个项目,该项目使用python中的tfidf获得文档集中最相关的10个单词。但是,在相同的单 -
使用Numpy和Sklearn的余弦相似度输出不同
我有以下代码。我试图找出为什么在使用numpy点乘积与sklearn余弦相似度时余弦相似度会有所不同。我认 -
计算非英语文本字符串的余弦相似度
要创建一个Python脚本,该脚本可以比较两个文本字符串并确定它们的相似度。我发现进行比较的最佳方