使用预训练的 ELMo 生成词嵌入 E

2024-05-19 • 问答

我正在尝试了解 ELMo 的设计方式及其工作原理，但我有几个问题：

ELMo 架构（如下图所示）是用于训练模型，还是用于使用预训练模型生成依赖于上下文的嵌入？还是两者都一样？

在将输入传递给 Bi-LSTM 层之前，它会通过卷积神经网络 (cnn) 将单词转换为原始单词向量（基于字符）。 cnn如何做到这一点？有什么有用的参考资料吗？

谢谢。

adayho 回答：使用预训练的 ELMo 生成词嵌入 E

暂时没有好的解决方案，如果你有好的解决方案，请发邮件至：iooj@foxmail.com

conv-neural-network elmo word-embedding

本文链接：https://www.f2er.com/97110.html