结合词数组和向量数组以创建Gensim W2V模型

我有一个pickle文件中的单词数组,还有一个npy文件中的对应矢量数组,我该如何将它们组合成Gensim W2V模型?

iCMS 回答:结合词数组和向量数组以创建Gensim W2V模型

仅创建一个完整的Word2Vec模型实例是不够的,该实例通常是通过对文本语料库进行调查然后对其进行训练而创建的。 (这些步骤还编译了必要的词频并训练了不在一组词向量中的内部模型权重。)

您可以创建尺寸正确的gensim KeyedVectors实例,然后使用其.add()方法添加值。这就要求您以相同的顺序列出单词和向量数组。这样可以对字向量进行大量标准操作,例如.most_similar(),但不允许进一步的word2vec训练。

例如:

from gensim.models import KeyedVectors
kv = KeyedVectors(vector_size)
kv.add(list_of_words,array_of_vectors)
print(kv.most_similar('apple'))
本文链接:https://www.f2er.com/2157855.html

大家都在问