量化精度损失影响因素
我们都知道,量化实际上就是一个从浮点分布到定点分布的过程,大致过程如下:

如果有对这个过程不是很了解的,可以去参考我之前写的另外一篇文章,
那么这样一个过程我们就可以看出来,我们肯定是尽可能希望所有浮点数都相对集中在一起,这样可以尽可能保证大部分点的精度,比如自然界最常见的高斯分布(当然相信之前看过一些文章同学都知道,一个训练均衡的网络的权重分布也是比较接近高斯分布的)。

但是这个定理一定是绝对的吗?让我们以一个比较典型的网络来做实验
实验初始条件
我们在实际量化过程中发现densenet121量化成8bit会精度掉点严重,通过排查发现是一个conv的影响很大.
conv的weights如下:

bias如下:

我们可以看到这里面的数据分

1323

被折叠的 条评论
为什么被折叠?



