Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation
这篇文章的两大贡献:
1、RNN Encoder-Decoder
2、GRU (Gated Recurrent Unit)
Abstract
提出了Encoder-Decoder结构,包含两个RNN
其中一个将序列编码为固定长度的向量表示
Decoder将向量解码为目标序列
两个RNN是联合训练的,训练目标是给定源序列的情况下,最大化目标序列的条件概率。
在已有的log-linear翻译模型中使用Encoder-Decoder计算出来的条件概率作为额外的特征可以提高现有模型的性能。
Encoder-Decoder还能学习到语义和语法表示(learns semantically and syntactically meaningful representation of linguiistic phrases)
Introduction
- 统计翻译模型(SMT, Statistical Machine Translation)
- phras-based SMT System
- RNN Encoder-Decoder(proposed by this paper) can be used as a part of the conven
该论文介绍了RNN Encoder-Decoder结构,包括GRU单元,用于统计机器翻译。该模型能学习到词和短语的语义和语法表示,改善SMT系统的性能。实验表明,它在英语到法语翻译任务中提高了传统phrase-based方法的效果。
订阅专栏 解锁全文
1679

被折叠的 条评论
为什么被折叠?



