lstm 加多头注意力MultiHeadAttention

本文介绍了LSTM与多头注意力(MultiHeadAttention)在CVPR2022场景分割任务中的应用。文章详细讨论了注意力机制的重要性,以及线性变换在模型中的作用,包括旋转、平移和缩放。实验结果显示,在模型中加入MultiHeadAttention可以提升效果,并且在头和尾部添加注意力机制能进一步优化性能。ReLU6作为激活函数对比gelu展现出更好的效果。

目录

价值千金,懂的自然懂

CVPR2022 场景分割用到了lstm:

注意力机制

线性变换


价值千金,懂的自然懂

CVPR2022 场景分割用到了lstm:

场景切割CVPr2022 SceneSegmentation-CSDN博客

注意力机制

qxk的转置,结果和v进行矩阵相乘,给v做个线性变换

线性变换

包括旋转,平移,缩放

2023.1210 MultiHeadAttention放在后面效果更好。

2023.1211: MultiHeadAttention头和尾各加一个,效果又有改善

分类的激活函数relu6比gelu效果更好。

import
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI算法网奇

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值