[发明专利]一种基于注意力机制的三维卷积微表情识别算法在审
申请号: | 202010847866.1 | 申请日: | 2020-08-21 |
公开(公告)号: | CN112115796A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 赵国英;毋婷婷;李展;樊青晨;刘盱衡;张海;彭进业;温超;章勇勤;杨溪 | 申请(专利权)人: | 西北大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 祁凡雨 |
地址: | 710069 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 三维 卷积 表情 识别 算法 | ||
1.一种基于注意力机制三维卷积微表情识别网络模型的建立方法,其特征在于,包括以下步骤:
步骤1,采用自监督方法对微表情视频序列数据集进行光流提取,得到光流序列:提取后每个微表情视频序列均对应一组光流序列;
步骤2,建立基于注意力机制三维卷积微表情识别网络模型:
包括卷积层,池化层,Attention层,Co-Attention层,以及全连接层和分类器;
通过Attention层将步骤1的微表情视频序列与步骤1得到的光流序列分别经过视频序列特征提取与光流序列特征提取,得到视频序列特征向量和光流序列特征向量;
通过Co-Attention层将Attention层得到的视频序列特征向量和光流序列特征向量的相互引导并融合,得到联合特征向量;
将所述联合特征向量输入到全连接层进行微表情分类识别,得到微表情分类识别结果;
使用交叉熵函数作为该网络模型的损失函数,并使用Adam优化策略来训练网络模型学习,该网络模型是双流输入,训练时该网络模型的输入为步骤1的微表情视频序列和对应的得到的光流序列,输出是positive、surprise、negative和other中的其中一种。
2.如权利要求1所述基于注意力机制三维卷积微表情识别网络模型的建立方法,其特征在于,步骤1前需要对数据集进行预处理,该数据集包括多个微表情视频序列,每个微表情视频序列均由一组视频帧构成。
3.如权利要求1所述基于注意力机制三维卷积微表情识别网络模型的建立方法,其特征在于,所述步骤1预处理的方法依次包括:对数据集中的每个视频序列进行人脸剪裁、人脸对齐、视频序列帧数统一。
4.如权利要求1所述基于注意力机制三维卷积微表情识别网络模型的建立方法,其特征在于,步骤2中,通过视频序列特征向量和光流序列特征向量得到联合特征向量包括:先使用视频序列特征向量引导光流序列特征向量,得到引导之后的光流序列特征向量,再使用引导之后的光流序列特征向量引导视频序列特征向量,得到引导后的视频序列特征向量;
将引导后的光流序列特征向量与引导后的视频序列特征向量进行融合,得到联合特征向量。
5.一种基于注意力机制的三维卷积微表情识别方法,其特征在于,将待识别的微表情片段输入到权利要求1或2或3或4所述的网络模型中,得到微表情分类识别结果:positive、surprise、negative、other。
6.一种基于注意力机制的三维卷积微表情识别系统,其特征在于,该系统包括预处理模块以及权利要求1或2或3或4所述的基于注意力机制的三维卷积微表情识别网络模型;
所述预处理模块用于依次对待识别的微表情视频序列进行人脸剪裁、人脸对齐和视频序列帧数统一;
预处理后的待识别的微表情视频序列输入所述基于注意力机制三维卷积微表情识别网络模型用于进行待识别的微表情的分类识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010847866.1/1.html,转载请声明来源钻瓜专利网。