使用预训练的 ELMo 生成词嵌入 E

我正在尝试了解 ELMo 的设计方式及其工作原理,但我有几个问题:

  1. ELMo 架构(如下图所示)是用于训练模型,还是用于使用预训练模型生成依赖于上下文的嵌入?还是两者都一样?

    使用预训练的 ELMo 生成词嵌入 E

Source

  1. 在将输入传递给 Bi-LSTM 层之前,它会通过卷积神经网络 (cnn) 将单词转换为原始单词向量(基于字符)。 cnn如何做到这一点?有什么有用的参考资料吗?

谢谢。

adayho 回答:使用预训练的 ELMo 生成词嵌入 E

暂时没有好的解决方案,如果你有好的解决方案,请发邮件至:iooj@foxmail.com
本文链接:https://www.f2er.com/97110.html

大家都在问