基于LBP特征的面部表情识别方法
摘要如今,人的表情识别在智能人机交互中发挥着越来越重要的作用。本论文提出一种全自动识别人脸七种基本表情的方法,该方法首先利用局部二值模式提取面部表情特征,然后用C均值聚类的方法对样本聚类得到表情模板,最后使用K近邻算法进行表情图像的识别。通过采用日本的JAFFE表情数据库来检测算法的性能,验证了方法的有效性。
【关键词】面部表情识别 局部二值模式 C均值 K近邻
1 概述
人的表情识别在模式识别领域中受到广泛关注,特别是从静态图像中识别表情比从图像序列中进行难度更大。人的表情信息主要是通过嘴巴、眼睛、眉毛等部位的变化体现出来的,而这些变化体现在图像中就是图像边缘的变化。而局部二值模式(LBP)能够有效的描述图像的局部纹理信息,并且对由于光照引起的灰度变化具有不变性。
2 提取面部表情的LBP特征
2.1 LBP
LBP的原理是以一个像素点的灰度值作为阈值,将这个点的3*3邻域点的灰度值与它进行比较,假设比阈值大的为1,比阈值小的就为0,再以一定的顺序将它们连起来就得到一串二进制数,二进制数转换成十进制数,就得到了该点的LBP值,这是基本LBP算子。
然而基本LBP算子的缺点是3*3的邻域太小,所以将基本LBP算子扩展为任意邻域大小的LBP算子,记作LBPP,R。它是通过使用圆形的邻域和双线性插值运算来实现的。
对LBP算子的进一步扩展是统一化模式,通常记作。对于一个LBP二进制位串,如果其中从0到1或者从1到0的变化不多于两个,则为统一化LBP算子。然后对于图像每一像素点的LBP模式,如果是统一化模式则赋值为1,不是统一化模式则为0,这就得到了整幅图像的LBP直方图。
2.2 表情图像的LBP直方图提取
LBP直方图主要包含了图像的微小信息,比如说边缘,点,但为了更好的得到图像的特征,图像的空间特征也是必须的。因此我们将表情图像划分成若干小的,不重复的区域,分别计算每一小区域的统一化LBP直方图,再将各个小区域的统一化LBP直方图连起来就是整幅图像的LBP直方图了。
3 C均值聚类算法和K近邻算法
本文首先使用了C均值聚类算法对表情进行聚类,得到表情模板。下面是C均值聚类算法的简单描述:首先,需要确定类别数C,本文的类别数是7,分别代表高兴、生气、恐惧、厌恶、害怕、悲伤和中性;然后随机选择训练集中的C个样本作为最初的质心;分别计算训练集中其他样本到这C个质心的欧式距离,根据最近邻的方法,将这些训练集进行分类,此时完成了第1次迭代过程;接下来更新这7个类的质心,得到新的质心后计算所有训练样本到各个质心的欧式距离,根据最近邻法再将所有点进行一次分类。就这样反复迭代,直到达到预设的迭代次数为止。
识别的过程是采用K近邻算法对每个测试样本进行识别。K近邻就是分别计算测试样本与已知样本的距离,取前k个近邻,看这k个近邻中属于7类表情中的哪类最多,那么识别结果就是那一类。
总之,先采用C均值聚类算法进行表情的聚类,得到表情模板,在通过K近邻算法进行分类,这就是整个识别过程。
4 实验
实验是在日本女人表情数据库(Japanese female facial expression,JAFFE)上进行的。JAFFE数据库共有213幅表情图像,来自于10个日本女人,每个人20幅图像左右,每个人7种表情。
实验过程中,我们将这些图像分为10个部分,每个人的表情图像对应一部分。我们进行了10次实验,每次实验采用其中的9部分作为训练集进行训练,剩下的那一部分图像作为测试集用来进行测试。最终得到10个识别结果,然后在计算出整个的平均识别率。结果如表1所示。
5 结论
本文所采用的方法在没有人工干预的情况下,识别率达到了52.7%,相比其他要人工选取基准点的方法取得了较好的效果。
参考文献
[1] Claude C,Chibelushi,Fabrice Bourel.Facial expression recognition: A brief tutorial overview[J].On-Line Compendium of Computer Vision,2003.
[2] Caifeng Shan,Shaogang Gong and Peter W. McOwan.Robust facial expression recognition using local binary patterns[J].Image Processing, 2005.
[3] 张铮,王艳平,薛桂香.数字图像处理与机器视觉[M].北京:人民邮电出版社,2010:406-408.
[4]边肇祺,张学工.模式识别[M].北京:清华大学出版社,2000.
[5]X Feng,M Pietikainen,A Hadid.Facial expression recognition with local binary patterns and linear programming[J].Pattern Recognition And Image Analysis,2005.
作者单位
天津师范大学天津市300387