lstm 加多头注意力MultiHeadAttention

原创已于 2024-06-03 17:55:39 修改 · 1.1k 阅读

·

9

·

文章标签：

#深度学习 #python #pytorch

于 2023-11-28 06:17:23 首次发布

深度学习宝典同时被 2 个专栏收录

1106 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

pytorch知识宝典

518 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了LSTM与多头注意力（MultiHeadAttention）在CVPR2022场景分割任务中的应用。文章详细讨论了注意力机制的重要性，以及线性变换在模型中的作用，包括旋转、平移和缩放。实验结果显示，在模型中加入MultiHeadAttention可以提升效果，并且在头和尾部添加注意力机制能进一步优化性能。ReLU6作为激活函数对比gelu展现出更好的效果。

目录

价值千金，懂的自然懂

CVPR2022 场景分割用到了lstm：

注意力机制

价值千金，懂的自然懂

CVPR2022 场景分割用到了lstm：

场景切割CVPr2022 SceneSegmentation-CSDN博客

注意力机制

qxk的转置，结果和v进行矩阵相乘，给v做个线性变换

线性变换

包括旋转，平移，缩放

2023.1210 MultiHeadAttention放在后面效果更好。

2023.1211： MultiHeadAttention头和尾各加一个，效果又有改善

分类的激活函数relu6比gelu效果更好。

import

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AI算法网奇 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。