【论文精读】Resnet残差网络(Deep Residual Learning for Image Recognition)

本文介绍了深度网络中出现的退化问题,通过引入快捷连接和残差网络结构来解决。作者探讨了底层映射的概念,提出通过添加自身映射(快捷连接)的方式让网络逼近底层映射,从而避免深度增加导致的性能下降。实验结果显示,残差网络在ImageNet和CIFAR-10数据集上表现出更好的深度优势和收敛性。

简介

本文作者是何恺明,张祥雨,任少卿,孙健;2016年发布在IEEE上;

本文提出深层网络出现的退化问题,通过提出添加快捷连接来解决

一、底层知时

1.1退化问题

图像识别任务中,网络性能可以通过堆加网络深度得以提升

但这个过程往往不是线性的,当网络层数足够深时,退化问题开始显现了;

退化问题不是由过拟合引起,当识别精度趋于收敛时,增加网络层数会导致训练误差增加

1.2底层映射

常规网络中,我们的优化目标是是我们的网络可以逼近底层映射(underlying mapping)

在分类问题中,底层映射是一种基于上帝视角,可以完全将输入样本特征映射成标签的映射,即f(x)=y,其中f(\cdot)便是底层映射,x,y为样本的特征和标签;

现实生活中这种映射往往难以找到,所以我们希望训练出一种映射去逼近底层映射,即

f'(x)\rightarrow f(x)

1.3快捷连接

自然界有一种十分简单的映射模式,这种映射将输入映射至其本身,即f(x)=x,我们称这种映射模式为自身映射(identity mapping),或是恒等映射

我们将底层映射定义为H(x);如果神经网络可以拟合底层映射H(x),那么一样可以拟合

H(x)-x

如果我们把由网络块堆叠而成的神经网络称为原始映射(original mapping)F(x)

相比于传统神经网络

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值