word2vec

如何使用gensim keyedvectors查找两个给定单词之间的连接单词？

使用gensim，我可以用以下代码来解决方程式“国王+女人-男人=女王”： <pre class="lang-py prettyprint-overri

前端之家
2022-08-16 • 问答
显示一维形状的二维二维numpy ndarray

我从以下函数中获取了一个numpy数组 <pre><code>def get_word_vec_norm(post): doc = nlp(post) word_vec = [] in

前端之家
2022-08-16 • 问答
如何手动将单词和向量添加到Word2vec gensim？

比方说， word2vec.model 是我训练有素的word2vec模型。当出现单词外单词（ oov_word 

前端之家
2022-08-16 • 问答
如何从pytorch调整后的BERT输出logit

我使用huggingface库在pytorch中微调了预训练的BERT模型。 <pre><code>def finetune_BERT(): ... return model </code>

前端之家
2022-08-16 • 问答
'similar_by_word'在迭代中没有改善

我正在使用Gensim来训练一个跳过语法的word2vec模型。数据集有100万个句子，但词汇量为200个。我想了解迭

前端之家
2022-08-16 • 问答
如何释放pyspark模型（JavaModel）占用的内存？

如上所述，我通过pyspark加载了经过训练的word2vec模型。 <pre><code>word2vec_model = Word2VecModel.load("saving

前端之家
2022-08-16 • 问答
word2vec中的类似单词是否有波兰语实现？

我找到了GoogleNews-vectors-negative300.bin库，但仅适用于ENG单词，在word2vec中是否有针对类似单词的波兰语实

前端之家
2022-08-15 • 问答
用于Word2Vec模型测试的问题对（基本事实）数据集？

我正在寻找测试数据集来优化我的Word2Vec模型。我从gensim找到了一个不错的产品： gensim / test / test

前端之家
2022-08-15 • 问答
Word2Vec子采样-实现

我正在Pytorch和Tensorflow2中实现<a href="https://arxiv.org/pdf/1310.4546.pdf" rel="nofollow noreferrer">Skipgram</a>模型。我

前端之家
2022-08-15 • 问答
有什么办法可以理解word2vec的输出功能？

我想了解word2vec输出中每个维度的含义。例如，如果我用一个热编码变量创建一个决策树，则可以

前端之家
2022-08-15 • 问答
如何在kerase> 2.0中使用Merge？

<pre><code>word_model=Sequential() word_model.add(Embedding(vocab_size,embed_size, embeddings_initializer="glorot_uniform&

前端之家
2022-08-15 • 问答
如何将gensim的KeyedVectors对象存储在Redis Queue worker内部的全局变量中

我正在尝试将数据存储在Redis Queue（RQ）工作器内的全局变量中，以便使此数据保持预加载状态，即不需

前端之家
2022-08-15 • 问答
在快速文本跳过图训练中，如果语料库中的某些句子只有一个单词，将会发生什么？

想象一下，您有一个语料库，其中某些行仅包含一个单词，因此某些单词周围没有上下文。在这种情况

前端之家
2022-08-15 • 问答
Gensim中的分批训练word2vec在多名工人的支持下

上下文 关于如何使用<code>Word2Vec</code>和流数据训练<code>gensim</code>，存在几个问题。

前端之家
2022-08-15 • 问答
使用word2vec编码分类特征是一个好主意吗？

我正面临一个二进制预测任务，并且具有一组所有功能都是分类的。因此，一个关键的挑战是将这些分

前端之家
2022-08-15 • 问答
kmeans.cluster（）在对句子使用词嵌入（word2vec）时给出错误“ TypeError：'float'对象不可迭代”

我正在尝试使用kmeans对句子进行聚类但没有正确输入<code>cluster()</code>的输入类型。我尝试将列

前端之家
2022-08-14 • 问答
保存word2vec模型会导致文件混乱

以word2vec文本格式保存word2vec会得到一个其中包含奇怪字符的文件。 <img src="https://i.stack.imgur.com/dL

前端之家
2022-08-14 • 问答
如何通过CBOW（GenSim）从一组输入单词中找到最相似的单词？

我使用GenSim和CBOW来训练语料库。如何从一组输入单词中获得最相似的单词？例如：给定一组输入

前端之家
2022-08-14 • 问答
尝试运行Word嵌入基准并获取UnicodeDecodeError

我正在尝试在我创建的word2vec嵌入中运行来自此Github：<a href="https://github.com/kudkudak/word-embeddings-benchmarks" r

前端之家
2022-08-14 • 问答
用于语义句子相似性的连体LSTM不能提高验证准确性

我想找到两个句子的数据集之间的语义句子相似度。如标题中所述，验证准确性并未提高。我的精度为0

前端之家
2022-08-14 • 问答
如何用新词汇逐步训练word2vec模型

我有一个超过40G的数据集。由于内存有限，令牌生成器的程序被杀死，因此我尝试拆分数据集。如何逐

前端之家
2022-08-14 • 问答
Gensim most_like方法系数非常低

我使用gensim训练了词嵌入word2vec模型，然后使用most_like方法找到关联最多的词。 <pre><code>Word to search:

前端之家
2022-08-14 • 问答
减少Facebook FastText Word2Vec的大小

我正在构建一个机器学习模型，该模型将处理文档并从中提取一些关键信息。为此，我需要对OCRed输出使

前端之家
2022-08-14 • 问答
如何在自训练的word2vec模型中删除单词

我有一个自我训练的word2vec模型（2G，以“ .model”结尾）。我将模型转换为文本文件（超过50G，以“ .txt

前端之家
2022-08-13 • 问答
我们如何使用word2vec表示来实现单词歧义消除？

我知道word2vec的工作原理，但是在寻找如何使用word2vec实现单词歧义消除时遇到了麻烦。您可以协助执行

前端之家
2022-08-13 • 问答
Gensim如何在Word2Vec中实现子采样？

我正在尝试在pytorch中重新实现wor2vec。我根据原始论文的<a href="https://github.com/tmikolov/word2vec/blob/20c129af1065

前端之家
2022-08-13 • 问答
如何在字典字典中将numpy数组添加为值？

假设我有以下变量： <pre><code>import gensim from gensim.models import KeyedVectors wv = KeyedVectors.load_word2vec_format(&

前端之家
2022-08-12 • 问答
MemoryError：在python中使用word2vec时无法分配形状和数据类型为float32的数组

我正在尝试从Wikipedia文本数据中训练word2vec模型，因为我正在使用以下代码。 <pre><code>import logging impo

前端之家
2022-08-12 • 问答
Word2Vec Vocab的相似之处

我在大约750k个单词的文本上运行了word2vec算法（在删除一些停用词之前）。使用我的模型，我开始查看

前端之家
2022-08-12 • 问答
Gensim doc2vec培训停滞

我已经在10个时期训练了gensim doc2vec模型几天。它一直运行平稳，直到上一个纪元达到79.29％，然后突然

前端之家
2022-08-12 • 问答

首页

下一页
末页