[发明专利]基于模拟生物视觉神经网络的人脸表情识别方法及系统在审
申请号: | 201310419079.7 | 申请日: | 2013-09-13 |
公开(公告)号: | CN103488974A | 公开(公告)日: | 2014-01-01 |
发明(设计)人: | 桑农;欧阳琰;高常鑫 | 申请(专利权)人: | 南京华图信息技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/38;G06K9/62;G06N3/02 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 210012 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模拟 生物 视觉 神经网络 表情 识别 方法 系统 | ||
技术领域
本发明涉及图像识别技术领域,特别涉及一种基于模拟生物视觉神经网络的人脸表情识别方法及系统。
背景技术
人脸表情识别技术能够让计算机做到看人的脸色行事,从而营造真正和谐的人机环境。表情识别方法主要包含两个步骤:特征提取和分类器构建。常用的特征提取方法为:Haar特征、LBP特征、Gabor特征、SIF。常用的分类器构建方法为:神经网络、支持向量机、Adaboost、主成分分析、隐马尔科夫模型。传统的表情识别方法在人脸表情识别中得到了广泛的应用,尤其在识别干净人脸图像时可以达到非常好的效果。但是在实际的识别过程中人脸表情图像可能存在遮挡和噪声,例如,在照相的过程中后排人脸很容易被前排人的肩膀或者手部分遮挡;相机在采集人脸图像由于受到光学设备影响会产生马赛克等噪声。因此研究出一种鲁棒的人脸表情识别方法成为一个难题。近年来,针对这一难题有许多的文献和专利提出了鲁棒的表情分类方法,其主要流程为对人脸表情图像进行分区,对每个小的分区提取常用特征,然后将这些局部特征与传统的分类方法结合构成新的表情识别方法,由于提取了大量的面部局部特征,传统的分类器能够通过人脸中非遮挡部位的特征信息对表情进行分类,因此对遮挡具有一定的鲁棒性。但是这一流程仍然只是传统模式识别方法的一种扩展,并且存在以下两种缺陷:(1)局部特征提取的方法非常多样且缺乏理论依据;(2)传统的模式识别方法依赖局部特征提供的信息达到对遮挡的鲁棒,而其本身并不能够对遮挡和噪声鲁棒。
由于人眼的视觉神经系统能够非常轻易的消除表情识别中的遮挡与噪声的影响,因此模拟生物视觉系统的表情识别方法不但提出了一种有别于传统表情识别方法的理论框架,而且解决了一些经典模式识别方法中容易受到噪声和遮挡影响的固有缺陷,提出了一套解决表情识别中能够对遮挡和噪声的鲁棒的新方法和新技术。辐射编码模型为模拟生物对刺激图像的视网膜到视觉皮层的映射过程,因此采用辐射编码模型来提取人脸表情图像的局部特征解决了传统鲁棒表情识别方法中局部特征提取方法缺乏理论依据的缺陷;而基于稀疏编码的分类方法是一种模拟生物视觉感知系统的分类器,稀疏编码认为每幅图像都可以看成是多个基函数的线性组合,当图像在某一频率和方向上有最明显的特征时,与之对应的神经元会有最大的响应,因此基于稀疏编码的分类方法具有人眼视觉系统的特性能够对部分遮挡鲁棒。
发明内容
本发明的目的旨在至少解决上述的技术缺陷之一。
为此,本发明的一个目的在于提出一种基于模拟生物视觉神经网络的人脸表情识别方法。所述人脸表情识别方法具有识别的准确率高的优点。
本发明的另一目的在于提出一种基于模拟生物视觉神经网络的人脸表情识别系统。
为达到上述目的,本发明一方面的实施例提出一种基于模拟生物视觉神经网络的人脸表情识别方法,包括以下步骤:构造表情图像库,并对所述表情图像库中的原始人脸图像进行归一化以得到表情图像;提取所述表情图像的局部二值化直方图特征和梯度直方图描述子;分别根据所述表情图像和所述局部二值化直方图特征以及所述表情图像和所述梯度直方图描述子构造第一分类器和第二分类器;以及对所述第一分类器的分类结果和所述第二分类器的分类结果进行融合以识别所述表情图像的表情。
根据本发明实施例的方法,通过表情图像的二值化直方图特征和梯度直方图描述子构造两个分类器,并对两个分类器的分类结果进行融合对表情图像进行精确的识别,提高了识别的准确率和鲁棒性,同时识别结果的融合增加了识别的可扩展性。
在本发明的一个实施例中,所述提取所述表情图像的局部二值化直方图特征,具体包括:通过二值化算子计算所述表情图像的二值化特征;将所述表情图像分割成多个图像块,并使相邻图像块部分重叠;以及连接所述多个图像块的二值化特征,以获得局部二值化直方图特征。
在本发明的一个实施例中,所述提取所述表情图像的梯度直方图描述子,具体包括:将所述表情图像转化为灰度图,并计算所述灰度图的梯度;将所述灰度图分割成多个单元格,并选择在单元格梯度投影中梯度直方图的方向,其中,所述多个单元格的相邻单元格部分重叠;以及对所述多个单元格的梯度进行归一化,并根据所述梯度直方图的方向获得梯度直方图描述子。
在本发明的一个实施例中,所述第一分类器和第二分类器分别根据稀疏编码系数对所述表情图像进行分类。
在本发明的一个实施例中,所述表情图像的表情包括:愤怒、厌恶、恐惧、高兴、悲伤和惊讶。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京华图信息技术有限公司,未经南京华图信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310419079.7/2.html,转载请声明来源钻瓜专利网。