【论文精读】Resnet残差网络（Deep Residual Learning for Image Recognition）

原创

已于 2024-04-02 16:19:18 修改 · 3.3k 阅读

·

9

·

于 2023-09-27 19:30:09 首次发布

本文介绍了深度网络中出现的退化问题，通过引入快捷连接和残差网络结构来解决。作者探讨了底层映射的概念，提出通过添加自身映射（快捷连接）的方式让网络逼近底层映射，从而避免深度增加导致的性能下降。实验结果显示，残差网络在ImageNet和CIFAR-10数据集上表现出更好的深度优势和收敛性。

简介

本文作者是何恺明，张祥雨，任少卿，孙健；2016年发布在IEEE上；

本文提出深层网络出现的退化问题，通过提出添加快捷连接来解决

一、底层知时

1.1退化问题

图像识别任务中，网络性能可以通过堆加网络深度得以提升

但这个过程往往不是线性的，当网络层数足够深时，退化问题开始显现了；

退化问题不是由过拟合引起，当识别精度趋于收敛时，增加网络层数会导致训练误差增加

1.2底层映射

常规网络中，我们的优化目标是是我们的网络可以逼近底层映射（underlying mapping）

在分类问题中，底层映射是一种基于上帝视角，可以完全将输入样本特征映射成标签的映射，即 $f(x)=y$ ，其中 $f(\cdot)$ 便是底层映射， $x,y$ 为样本的特征和标签；

现实生活中这种映射往往难以找到，所以我们希望训练出一种映射去逼近底层映射，即

$f'(x)\rightarrow f(x)$

1.3快捷连接

自然界有一种十分简单的映射模式，这种映射将输入映射至其本身，即 $f(x)=x$ ，我们称这种映射模式为自身映射（identity mapping），或是恒等映射

我们将底层映射定义为 $H(x)$ ；如果神经网络可以拟合底层映射 $H(x)$ ，那么一样可以拟合

$H(x)-x$ ；

如果我们把由网络块堆叠而成的神经网络称为原始映射（original mapping） $F(x)$

相比于传统神经网络

标签

#学习 #机器学习 #人工智能 #卷积神经网络 #神经网络

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。