Abstract
为了解决基于特征的检测方法不能有效迅速地检测较大差异的外表,本文借用通道特征的概念,将图像通道扩展为梯度幅值和梯度方向直方图,把丰富的信息用一种简单的方式表达,称其为聚合通道特征(ACF)。为了处理自然状态下的脸部多表情,提出了一种多视图检测方法(重新排序特征分数以及调整检测)
- 过去十年,提出的最具影响的脸部检测算法应该是
VJ框架。
VJ框架使用矩形Haar特征并且采用基于Adaboost的分类器学习算法(用此选择特征并进行学习,将弱分类器组合成强分类器)。同时将Adaboost构建的强分类器进行cascade级联可以达到实时检测。
VJ框架产生了很多子领域/方法,主要从两方面入手:①更复杂的特征,②更强的学习算法。boosting 和 级联(cascade)的算法架构已经证明了(在人脸检测领域)有效。目前主要的瓶颈是在特征表达,需要耗费很大的计算代价才能换来有限的性能提升。之后的行人检测领域中,通道特征已经实现较好性能。通道特征计算原始图像的特定映射(如梯度幅值和梯度方向直方图),提取这些扩展通道上的特征,分类器学习过程沿用了VJ框架。 - 本文提出了一种通道特征的变形体,即
聚合通道特征,可以对特征通道上的像素值降采样。扩展通道可以提供丰富的特征表达,另一方面简单特征可以保证计算较快。
通过对通道类型,特征池化大小,下采样方法,特征缩放等的研究,我们发现:
1)多尺度特征可以丰富特征表达能力,因为原始整合通道特征有尺度不变性
2)通道类型的不同结合方法会极大程度的影响效果:对face detection来说,LUV中的色彩通道+RGB中的梯度幅值+RGB中的梯度直方图=best
3)多角度检测使用ACF得到很好的效果,因为特征表达可以对脸部结构进行

该论文提出了一种名为聚合通道特征(ACF)的方法,用于增强多视图人脸检测的性能。通过扩展图像通道,包括梯度幅值和方向直方图,ACF能有效捕捉脸部的多样性。研究发现,LUV色彩通道加上RGB的梯度特征组合最佳。论文还探讨了多尺度特征、下采样策略和多视图检测的后处理技术,如置信度重新排序和边界框调整,以提高检测准确性和速度。
1万+

被折叠的 条评论
为什么被折叠?



