目录
价值千金,懂的自然懂
CVPR2022 场景分割用到了lstm:
场景切割CVPr2022 SceneSegmentation-CSDN博客
注意力机制
qxk的转置,结果和v进行矩阵相乘,给v做个线性变换
线性变换
包括旋转,平移,缩放
2023.1210 MultiHeadAttention放在后面效果更好。
2023.1211: MultiHeadAttention头和尾各加一个,效果又有改善
分类的激活函数relu6比gelu效果更好。
import
本文介绍了LSTM与多头注意力(MultiHeadAttention)在CVPR2022场景分割任务中的应用。文章详细讨论了注意力机制的重要性,以及线性变换在模型中的作用,包括旋转、平移和缩放。实验结果显示,在模型中加入MultiHeadAttention可以提升效果,并且在头和尾部添加注意力机制能进一步优化性能。ReLU6作为激活函数对比gelu展现出更好的效果。
目录
场景切割CVPr2022 SceneSegmentation-CSDN博客
qxk的转置,结果和v进行矩阵相乘,给v做个线性变换
包括旋转,平移,缩放
2023.1210 MultiHeadAttention放在后面效果更好。
2023.1211: MultiHeadAttention头和尾各加一个,效果又有改善
分类的激活函数relu6比gelu效果更好。
import
4万+

被折叠的 条评论
为什么被折叠?