我正在尝试使用 doc2vec 制作 gensim 示例的文档向量。 我通过了包含 9 个文档和 9 个标签的 TaggedDocument。
from gensim.test.utils import common_texts
from gensim.models.doc2vec import Doc2Vec,TaggedDocument
idx = [0,1,2,3,4,5,6,7,100]
documents = [TaggedDocument(doc,[i]) for doc,i in zip(common_texts,idx)]
model = Doc2Vec(documents,vector_size=5,window=2,min_count=1,workers=4)
它会产生 101 个像这个图像一样的向量。 gensim doc2vec produced 101 vectors
我想知道的是
- 如何确保我传递的标签附加到正确的向量上?
- 带有我没有通过的标签(在我的例子中是 8~99)的向量是如何出来的?它们是作为空白计算的吗?