上下文敏感张量和词向量之间的区别

我目前正在使用spacy在python中工作,并且有不同的预训练模型,例如en_core_web_sm或en_core_web_md。其中一个正在使用单词向量来查找单词相似度,而另一个正在使用上下文相关张量。 使用上下文敏感张量和使用词向量之间有什么区别?究竟什么是上下文敏感张量?

leyuruan 回答:上下文敏感张量和词向量之间的区别

单词向量存储在模型的一个大表中,当您查找cat时,总是从该表中获得相同的向量。

上下文相关的张量是由密集型特征向量组成,这些特征向量是在分析文本时由管道中的模型计算出的。在不同的文本中,您将获得cat的不同向量。如果您使用en_core_web_sm,则cat中的令牌I have a cat将不具有The cat is black中的向量。当模型不包含单词向量时,通过使用上下文相关的张量,可以使相似度函数在某种程度上起作用,但结果与单词向量相比有很大的不同。

在大多数情况下,您可能希望将_md_lg模型与单词向量一起使用。

本文链接:https://www.f2er.com/3168470.html

大家都在问