https://arxiv.org/abs/1506.02626v3
这是一篇关于模型压缩的15年文章,到目前为止(18年11月)有450的被引
文章介绍了一种参数剪枝(weights pruning)方法,应该算是最基础的一种方法了,直接按照参数是否大于某个阈值来判断哪些参数是重要的,哪些参数是不重要。文章主要目的是想要压缩模型大小后将模型运行在能耗更小的内部SRAM里,在速度提升上文章没有过多强调。
在不降低精度的前提下,在VGG-16上取得了13倍的参数压缩率,从138M个参数到10.8M个参数。

图1给出了同一处理器下各种操作所消耗能量的大小,主要看片内小存储的SRAM和片外小存储DRAM的能量消耗对比,可以看出在模型参数量很大的情况下,在进行运算的时候会大量访问DRAM,从而造成能量的大量消耗,这对移动端处理器是不能接受的。

图2给出了剪枝的过程。第一步和平时一样训练网络。第二步剪枝,删除w低于阈值的神经元,如图3。第三步重新训练。第二、三步多次循环迭代。
有几个问题:
1.在第一步训练的时候,文章说“Unlike conventional training, however, we are not learning the final values of the weights, but r

本文探讨了模型压缩中参数剪枝技术,介绍了基于权重阈值的剪枝方法,实现模型大小显著压缩,如VGG-16模型压缩13倍至10.8M参数,同时保持精度。讨论了剪枝、重训练过程及参数调整策略。
1055

被折叠的 条评论
为什么被折叠?



