论文笔记:GRU----RNN Encoder-Decoder

本文详细解析了GRU(门控循环单元)的工作原理,作为RNN Encoder-Decoder模型的一种改进。GRU通过Reset门和Update门有效处理长期依赖问题,相比于LSTM减少了参数数量,但依然能保持记忆能力。通过这两个门,GRU能够学习到不同时间步长的依赖关系,适应不同任务的需求。

<<Learning Phrase Representations using RNN Encoder–Decoderfor Statistical Machine Translation>>


这篇论文在传统的Encoder-Decoder模型上使用RNN,模型结构如下:


看图就知道要说什么了,亮点在于文章对隐层节点的创新:

先回顾下传统的 naive RNN:


看图就行,不多说。

再让我们回顾下传统的LSTM:


可以看到,


LSTM需要更新四组参数:分别是input gate  、forget gate 、 output gate 、还有对inp

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值