我想获得类似单词的列表。由于Spacy没有对此的内置支持,因此我想将spacy模型转换为gensim word2vec并获取相似单词的列表。
我尝试使用以下方法。但这很耗时。
def most_similar(word):
by_similarity = sorted(word.vocab,key=lambda w: word.similarity(w),reverse=True)
return [w.orth_ for w in by_similarity[:10]]
nlp = spacy.load('en_core_web_md')
nlp.to_disk(filename)
nlp.vocab.vectors.to_disk(filename)
这不会将模型保存到文本文件。因此,我无法使用以下方法。
from gensim.test.utils import datapath,get_tmpfile
from gensim.models import KeyedVectors
from gensim.scripts.glove2word2vec import glove2word2vec
glove_file = datapath('test_glove.txt')
tmp_file = get_tmpfile("test_word2vec.txt")
_ = glove2word2vec(glove_file,tmp_file)