[发明专利]一种基于卷积神经网络的人脸表情识别方法在审
申请号: | 201910229914.8 | 申请日: | 2019-03-22 |
公开(公告)号: | CN109934204A | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 李鹏华;陈俊名;陆相羽;易和阳;许清 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 新图像 人脸表情识别 眼睛中心位置 灰度图像 系统接收 表情 预处理 标准计算机 数据库评估 测试期间 人脸面部 实时操作 受控环境 输出预测 旋转校正 训练数据 归一化 网络权 下采样 可用 权重 裁剪 数据库 标签 验证 图像 输出 学习 | ||
1.一种基于卷积神经网络的人脸表情识别方法,其特征在于:采用卷积神经网络和特定图像预处理相结合来进行面部表情的识别,具体包括以下步骤:
S1、训练文本准备:在训练期间,系统接收包括脸部的灰度图像及其各自的表情标签和眼睛中心位置的训练数据,生成新图像以增加数据库大小;
S2、对生成新图像进行预处理:包括旋转校正,裁剪,下采样和灰度归一化,归一化后的新图像用于训练卷积神经网络;通过验证,输出获得最佳结果的权重值;
S3、测试文本:在测试期间,系统接收脸部的灰度图像以及其各自的眼睛中心位置,并且通过使用在训练期间学习到的最终网络权重来输出预测表达,判断该图像所属表情,使用soft-maxWithLoss损失函数替代了Logistic回归损失函数以获得更好的鲁棒性。
2.根据权利要求1所述的一种基于卷积神经网络的人脸表情识别方法,其特征在于:在步骤S1中,采用二维高斯分布:在σ=3和μ=0像素点,在眼睛中心位置引入随机噪声,通过考虑噪声处理后的眼睛位置的版本来生成合成图像。
3.根据权利要求2所述的一种基于卷积神经网络的人脸表情识别方法,其特征在于:在步骤S2中,对生成新图像进行预处理具体包括:
旋转校正:将人脸区域与水平线和中心点通过旋转归一化来进行校正;
裁剪:对原始图像中可能会降低分类准确性的背景信息进行裁剪;
下采样:执行缩减采样操作以减小网络的图像大小并确保缩放归一化,即所有图像中脸部器官的相同位置;下采样使用线性插值方法,在重新采样之后,保证眼睛中心大致处于相同的位置;
灰度归一化:包括两个过程:第一步执行减法局部对比归一化;第二步应用分歧的局部对比度归一化;在第一步中,每个像素的值从其邻居的高斯加权平均值中减去,在第二步中,每个像素除以其邻域的标准偏差;这两个过程的邻域使用77像素的内核;
归一化新图像用于训练卷积神经网络,通过验证,输出获得最佳结果的权重值。
4.根据权利要求3所述的一种基于卷积神经网络的人脸表情识别方法,其特征在于:在步骤S3中,搭建一个具有2个卷积层,2个下采样层和1个全连接层的CNN神经网络,第一层个卷积层卷积核为5x5,网络接收32x32灰度图像作为输入,该层之后是一个下采样层,它使用最大池将图像缩小到其大小的一半,该最大池内核大小为2x2;随后,一个新的卷积层用一个7x7内核执行64个卷积到前一层的映射,然后再进行另一个子采样,同样使用一个2x2内核;输出到一个全连接层,该层有256个神经元;最后,网络有六个或七个输出节点,每个输出其置信度的表达式一个;结合在训练期间学习到的最终网络权重输出每个表情所对应的表达式的值,具有最大值的类被用作图像中的表情所对应的表达式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910229914.8/1.html,转载请声明来源钻瓜专利网。