[发明专利]基于先验注意力机制引导的深度学习表情识别方法有效
申请号: | 202111153251.X | 申请日: | 2021-09-29 |
公开(公告)号: | CN113869229B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 李永杰;韦新栩;张显石 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/80;G06V10/82;G06N3/0464;G06N3/047;G06N3/08 |
代理公司: | 成都虹盛汇泉专利代理有限公司 51268 | 代理人: | 王伟 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 先验 注意力 机制 引导 深度 学习 表情 识别 方法 | ||
1.基于先验注意力机制引导的深度学习表情识别方法,其特征在于,包括以下步骤:
S1、对待识别的人脸图像进行人脸检测,获取人脸区域图像;
S2、对获取的人脸区域图像进行人脸关键点检测,计算双眼和嘴部的中心坐标;
S3、通过双眼和嘴部的中心点坐标截取眼部和嘴部三个区域;
S4、将S1中获取的人脸区域图像输入VGG16卷积神经网络提取深度特征,输出一个全局的一维特征向量;将S3中获取的眼部和嘴部区域一共三个区域的图像输入到另一个VGG16卷积神经网络中,分别输出三个局部的一维特征向量,最终得到四个一维特征向量;
S5、通过预先进行的眼动和注意力实验,获取S1中全局人脸图像和S3中三个局部区域图像对应的特征向量的权重系数;
S6、将每个特征向量与其对应的权重系数相乘;
S7、进行特征融合,将相乘后的四个一维特征向量进行拼接操作,得到一个更大的一维向量;
S8、将S7中得到的特征向量输入全连接层进行特征降维;
S9、通过Softmax激活函数激活得到对应表情类别。
2.根据权利要求1所述的基于先验注意力机制引导的深度学习表情识别方法,其特征在于,所述步骤S3中具体实现方法为:将S1中获取的人脸区域图像Resize为96x96像素大小,通过S3获取的三个中心坐标,将左右眼和嘴部区域从人脸区域截取出来,每个部分截取的大小为36x36。
3.根据权利要求1所述的基于先验注意力机制引导的深度学习表情识别方法,其特征在于,所述步骤S5具体实现方法为:
S51、通过预先进行的眼动和注意力实验,记录下眼动注视点分布图;
S52、将人脸图像Resize成为96x96像素大小,统计整个人脸表情图像注视点的个数,然后按照S3的方法截取左右眼和嘴巴三个区域;
S53、分别计算整个人脸表情图片及截取出来的左右眼和嘴巴四个区域的相对注视点分布比例系数,作为对应的特征向量的权重系数,计算方式为:
人脸区域:
左眼区域:
右眼区域:
嘴部区域:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111153251.X/1.html,转载请声明来源钻瓜专利网。