卷积(Convolutions)
目录
卷积贯穿着很多计算机视觉的任务,包括现在热门的深度学习网络——卷积神经网络。
在这篇文章中,主要介绍卷积的线性操作,通过理解卷积在图像去噪的应用,引出高斯函数,深入理解卷积。
(一)图像类型

1.二进制图像(Binary)
在一个分辨率为p×q(宽度×高度)的图像中,每一个元素由0和1表示,要么是0(黑色),要么是1(白色),每一个点占1bit。

2.灰度图像(Gray Scale)
在一个分辨率为p×q的图像中,每个像素点的取值有256种,每一个点占1byte

3.彩色图像(Color)
在一个分辨率为p×q的图像中,一个点有三个通道,分别是R、G、B,每个通道上元素的取值有256种,因此每个点用3byte表示。

(二)卷积操作
1.卷积核
噪声点:比周围的像素点较突兀的点。
如何去除噪声点,让图像效果更加平滑?
去除噪声点的一种最直接的思想就是把该点和周围的点平均一下,用周围点和该点的加权平均值作为该点的值
带权值的点构成的窗口称为卷积核,也称为滤波核。我们通过卷积核可以得知周围每个点的权重是多少。
卷积核模板的大小一般是奇数的,3×3、5×5、7×7。
具体是如何做的呢?
2.卷积操作

假设现在有一个图像f和一个卷积核g。
(1)首先,卷积核需要进行翻转(图像上的卷积核已经完成了翻转)
(2)经过翻转后的卷积核放置图像的左上方,从左上方开始对像素点进行运算。
(3)卷积后的图像上一点的值等于将卷积核模板的值(卷积核的中心点对应图像该点的位置)和对应位置的图像上点的值相乘后累加得到的值,这就是一个点的卷积操作的全过程。
(4)对于整个图像的卷积操作就是将卷积核平移,让每个点都进行一次卷积操作。
解释公式各符号的含义:
k,l的取值有-1、0、1;
[m,n]为卷积核的中心点在图像上的坐标;
f[x,y]为该点的图像的像素值;m-k与n-l实现卷积核的翻转;
g[x,y]为该点的卷积核的值,g[0,0]为卷积核的中心点的值。
3.性质
(1)线性
f1,f2两张图像,先求和再卷积与每张图像卷积之后再求和是一样的。
(2)平移不变性
先对图像平移再卷积与先对图像卷积再平移是一样的,因为卷积操作是对周围小邻域进行操作,平移并没有改变周围点的值。
推导出结论:任何平移不变的操作都可以用卷积操作
(3)其它的性质

4.类型
(1)原图

本文详细介绍卷积在图像处理中的应用,包括卷积核、卷积操作、图像填充等概念,并探讨高斯函数和中值滤波在去噪方面的优劣。
3983

被折叠的 条评论
为什么被折叠?



