简介
本文作者是何恺明,张祥雨,任少卿,孙健;2016年发布在IEEE上;
本文提出深层网络出现的退化问题,通过提出添加快捷连接来解决
一、底层知时
1.1退化问题
图像识别任务中,网络性能可以通过堆加网络深度得以提升
但这个过程往往不是线性的,当网络层数足够深时,退化问题开始显现了;
退化问题不是由过拟合引起,当识别精度趋于收敛时,增加网络层数会导致训练误差增加

1.2底层映射
常规网络中,我们的优化目标是是我们的网络可以逼近底层映射(underlying mapping)
在分类问题中,底层映射是一种基于上帝视角,可以完全将输入样本特征映射成标签的映射,即,其中
便是底层映射,
为样本的特征和标签;
现实生活中这种映射往往难以找到,所以我们希望训练出一种映射去逼近底层映射,即
1.3快捷连接
自然界有一种十分简单的映射模式,这种映射将输入映射至其本身,即,我们称这种映射模式为自身映射(identity mapping),或是恒等映射
我们将底层映射定义为;如果神经网络可以拟合底层映射
,那么一样可以拟合
;
如果我们把由网络块堆叠而成的神经网络称为原始映射(original mapping)
相比于传统神经网络

本文介绍了深度网络中出现的退化问题,通过引入快捷连接和残差网络结构来解决。作者探讨了底层映射的概念,提出通过添加自身映射(快捷连接)的方式让网络逼近底层映射,从而避免深度增加导致的性能下降。实验结果显示,残差网络在ImageNet和CIFAR-10数据集上表现出更好的深度优势和收敛性。
1915

被折叠的 条评论
为什么被折叠?



