上下文敏感张量和词向量之间的区别

2024-05-06 • 问答

我目前正在使用spacy在python中工作，并且有不同的预训练模型，例如en_core_web_sm或en_core_web_md。其中一个正在使用单词向量来查找单词相似度，而另一个正在使用上下文相关张量。使用上下文敏感张量和使用词向量之间有什么区别？究竟什么是上下文敏感张量？

单词向量存储在模型的一个大表中，当您查找cat时，总是从该表中获得相同的向量。

上下文相关的张量是由密集型特征向量组成，这些特征向量是在分析文本时由管道中的模型计算出的。在不同的文本中，您将获得cat的不同向量。如果您使用en_core_web_sm，则cat中的令牌I have a cat将不具有The cat is black中的向量。当模型不包含单词向量时，通过使用上下文相关的张量，可以使相似度函数在某种程度上起作用，但结果与单词向量相比有很大的不同。

在大多数情况下，您可能希望将_md或_lg模型与单词向量一起使用。

上下文敏感张量和词向量之间的区别

leyuruan 回答：上下文敏感张量和词向量之间的区别

大家都在问