失眠网 > 人脸识别技术中的Gabor特征提取算法

人脸识别技术中的Gabor特征提取算法

时间：2023-02-08 20:12:50

相关推荐

人脸识别技术中的Gabor特征提取算法

前言

上篇文章中，讲述了语音识别技术中的DTW算法，DTW算法是用于模板匹配的。这篇文章我们将介绍人脸识别中的Gabor特征提取算法，Gabor算法是用在特征提取阶段。我们在这里对比一下语音识别的流程图和人脸识别技术的流程图，以便学习总结。

下图是基于DTW算法的语音识别技术的流程图：

下图是基于Gabor特征提取算法和SVM分类器的人脸检测与识别流程图，其中包括测试过程与训练过程。

Gabor特征提取算法简介

为什么选择它

Gabor 特征提取算法可以在不同方向上描述局部人脸特征，对光照、遮挡以及表情变换等情况具有较强的鲁棒性，即Gabor算法在异常和危险情况下具有较强的系统生存的能力。

先介绍一些基本概念作为引入

一维Gabor核：

其由一个高斯核与一个复数波的乘积定义为如下公式：

其中w(t)是高斯函数，s(t)是复数波，两者的一维数学表达式定义如下：

我们将s(t)代入一维Gabor公式可得下式：

我们将上述一维情况推广到二维

二维复数波定义如下，其中(x,y)表示空间域坐标，(u0,v0)表示频率域坐标。

二维高斯函数定义如下，其中σx,σy 分别为在x，y两个方向上的尺度参数，用来控制高斯函数在两个方向上的“展布”形状。(x0,y0)为高斯函数的中心点。K为高斯核的幅度的比例。

但是由于高斯函数还有旋转的操作，所以我们对坐标进行如下的变换：

由此，我们得到了坐标变换后的高斯函数公式，其中θ表示高斯核顺时针旋转的角度。

二维Gabor核

类似一维 Gabor 核，我们将二维高斯函数与二维复数波相乘，就得到了二维的Gabor核：

一个Gabor核能获取到图像某个频率邻域的响应情况，这个响应结果可以看做是图像的一个特征。如果我们用多个不同频率的Gabor核去获取图像在不同频率邻域的响应情况，最后就能形成图像在各个频率段的特征，这个特征就可以描述图像的频率信息了。

下图展示了一系列具有不同频率的 Gabor 核，用这些核与图像卷积，我们就能得到图像上每个点和其附近区域的频率分布情况。

经过 Gabor 滤波获到的人脸图像信息包含实部和虚部两部分，分别代表不同局部的人脸特征信息，为了提取更加全面的人脸特征信息，一般会采用两种特征值相结合的方法，比如幅值和相位信息。但 Gabor 的相位信息会因为人脸空间位置发生改变而不太稳定。Gabor 幅值信息变化相对稳定，并且充分反映了人脸图像的能量谱。因此采取 Gabor 幅值特征。经过Gabor幅值特征处理，得到了人脸 Gabor 特征信息。5 个尺度，8 个方向的 Gabor 特征提取图如下所示：

如果觉得《人脸识别技术中的Gabor特征提取算法》对你有帮助，请点赞、收藏，并留下你的观点哦！

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。