[发明专利]人脸表情识别的方法及装置有效
申请号: | 201511016827.2 | 申请日: | 2015-12-29 |
公开(公告)号: | CN105654049B | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 谭莲芝;李志锋;乔宇 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 张全文 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表情 识别 方法 装置 | ||
1.一种人脸表情识别的方法,其特征在于,所述方法包括:
获取符合预设条件的人脸图像;所述符合预设条件的人脸图像包括有侧脸的人脸图像、图像分辨率小于第一预设值的人脸图像和/或人脸被遮挡的部分大于第二预设值且小于第三预设值的人脸图像;
采用多任务学习的深度卷积神经网络检测所述人脸图像中人脸68个特征点的位置;
根据检测到的所述68个特征点的位置,选取眼睛、鼻子和/或嘴角作为关键特征点,根据原人脸图像所述关键特征点的位置与校准后的人脸图像所述关键特征点的位置的映射关系,固定所述关键特征点在校准后的人脸图像中的位置,对所述人脸图像采用基于仿射变换的相似性变换,变换后将原人脸图像上的所述关键特征点按比例对应到校准后的人脸图像上;
获取人脸表情数据库;
将所述人脸表情数据库中的人脸表情图像作为训练数据集,并对所述训练数据集进行所述校准处理;
对校准处理后的所述训练数据集进行数据增强处理,使得所述训练数据扩大到原来的20倍;
通过数据增强处理后的所述训练数据集对深度卷积神经网络进行训练,获得训练后的所述深度卷积神经网络;
通过训练后的所述深度卷积神经网络对校准后的所述人脸图像进行人脸表情识别,并输出识别结果。
2.如权利要求1所述的人脸表情识别的方法,其特征在于,所述对校准后的所述训练数据集进行数据增强处理包括:
对校准后的所述训练数据集中的人脸表情图像进行水平镜像、旋转和平移放大处理。
3.如权利要求2所述的人脸表情识别的方法,其特征在于,所述对校准后的所述训练数据集中的人脸表情图像进行水平镜像、旋转和平移放大处理包括:
将校准后的所述训练数据集中的人脸表情图像水平翻转,获得水平镜像图像;和/或,
将校准后的所述训练数据集中的人脸表情图像旋转得到M张旋转图像,其中M为大于零的整数;和/或,
将校准后的所述训练数据集中的人脸表情图像平移放大得到L张平移图像,其中L为大于零的整数。
4.如权利要求1至3任一项所述的人脸表情识别的方法,其特征在于,所述深度卷积神经网络为五层卷积神经网络,学习率初始化为0.001且第四层卷积层和第四层池化层两层的特征输入到第五层卷积层。
5.一种人脸表情识别的装置,其特征在于,所述装置包括:
人脸图像获取单元,用于获取符合预设条件的人脸图像;所述符合预设条件的人脸图像包括有侧脸的人脸图像、图像分辨率小于第一预设值的人脸图像和/或人脸被遮挡的部分大于第二预设值且小于第三预设值的人脸图像;
检测单元,用于采用多任务学习的深度卷积神经网络检测所述人脸图像中人脸68个特征点的位置;
校准单元,用于根据检测到的所述68个特征点的位置,选取眼睛、鼻子和/或嘴角作为关键特征点,根据原人脸图像所述关键特征点的位置与校准后的人脸图像所述关键特征点的位置的映射关系,固定所述关键特征点在校准后的人脸图像中的位置,对所述人脸图像采用基于仿射变换的相似性变换,变换后将原人脸图像上的所述关键特征点按比例对应到校准后的人脸图像上;
识别单元,用于通过已训练完成的深度卷积神经网络对校准后的所述人脸图像进行人脸表情识别,并输出识别结果;
所述识别单元包括:
人脸表情获取模块,用于获取人脸表情数据库;
校准模块,用于将所述人脸表情数据库中的人脸表情图像作为训练数据集,并对所述训练数据集进行所述校准处理;
数据增强处理模块,用于对校准处理后的所述训练数据集进行数据增强处理,使得所述训练数据扩大到原来的20倍;
训练模块,用于通过数据增强处理后的所述训练数据集对深度卷积神经网络进行训练,获得训练后的所述深度卷积神经网络;
识别模块,用于通过训练后的所述深度卷积神经网络对校准后的所述人脸图像进行人脸表情识别,并输出识别结果。
6.如权利要求5所述的人脸表情识别的装置,其特征在于,所述数据增强处理模块具体用于:
对校准后的所述训练数据集中的人脸表情图像进行水平镜像、旋转和平移放大处理。
7.如权利要求6所述的人脸表情识别的装置,其特征在于,所述数据增强处理模块具体用于:
将校准后的所述训练数据集中的人脸表情图像水平翻转,获得水平镜像图像;和/或,
将校准后的所述训练数据集中的人脸表情图像旋转得到M张旋转图像,其中M为大于零的整数;和/或,
将校准后的所述训练数据集中的人脸表情图像平移放大得到L张平移图像,其中L为大于零的整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511016827.2/1.html,转载请声明来源钻瓜专利网。