[发明专利]一种基于改进深度卷积生成对抗网络的人脸表情识别方法有效

专利信息
申请号: 202111158933.X 申请日: 2021-09-30
公开(公告)号: CN113688799B 公开(公告)日: 2022-10-04
发明(设计)人: 史明光;陶玉兰 申请(专利权)人: 合肥工业大学
主分类号: G06V40/16 分类号: G06V40/16;G06V10/774;G06V10/764;G06V10/80;G06V10/82;G06N3/04;G06N3/08
代理公司: 安徽省合肥新安专利代理有限责任公司 34101 代理人: 陆丽莉;何梅生
地址: 230009 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 改进 深度 卷积 生成 对抗 网络 表情 识别 方法
【权利要求书】:

1.一种基于改进深度卷积生成对抗网络的人脸表情识别方法,其特征在于,包括以下步骤:

步骤1、获取人脸图像数据集并进行预处理:

获取真实人脸图像数据集并分别裁剪成尺寸为M×M的人脸图像,再对裁剪后的人脸图像随机添加的掩码,得到预处理后的人脸图像数据集记为X={x1,x2,...,xi,...,xN},其中,xi表示第i张人脸图像,i=1,2,...,N,N为人脸图像数据集中人脸图像的总数;

步骤2、构建生成网络G和双判别网络组成的改进深度卷积生成对抗网络:

步骤2.1、构建包括编码器和解码器组成的生成网络G;

所述编码器包括m层卷积层,所述解码器包括m层反卷积层;

设置所有卷积层的步长为2c、反卷积层的步长设为c;

设置卷积层的激活函数采用LeakyRelu函数,反卷积层的激活函数采用Relu函数;

在所述编码器的第1层卷积层与所述解码器的第m层反卷积层之间加入跳跃连接;在所述编码器的第2层卷积层与所述解码器的第m-1层反卷积层之间加入跳跃连接;依次类推,在所述编码器的第m层卷积层与所述解码器的第1层反卷积层之间加入跳跃连接;且每层卷积层和每层反卷积层后均设置有Padding操作;

所述第i张人脸图像xi经过所述生成网络G的编码和解码处理后得到维度为M×M的合成图像si

步骤2.2、建立如式(1)所示的重构损失Lrec

Lrec=||si-xi|| (1)

步骤2.3、采用如式(2)所示的最小二乘损失函数来建立生成网络G的损失函数L(G):

式(2)中,E表示数学期望,xi~pxi表示第i张人脸图像xi服从数据集中的人脸图像分布;D(si)表示双判别网络对合成图像si的预测值;

步骤2.4、利用式(3)构建生成网络G的总损失Ls(G):

Ls(G)=Lrec+L(G) (3)

步骤2.5、构建包括局部判别网络D_loc和全局判别网络D_glo的双判别网络:

所述局部判别网络D_loc是由w层卷积神经网络构成,且每个卷积层后采用Leaky Relu函数作为激活函数;

将所述维度为M×M的合成图像si中维度为的局部人脸图像输入所述局部判别网络D_loc中,并经过卷积操作后得到维度为1×1×h的特征向量;

所述全局判别网络D_glo是由w+1层卷积神经网络构成,且每个卷积层后采用LeakyRelu函数作为激活函数;

将所述维度为M×M的合成图像si输入所述全局判别网络D_glo中,并经过卷积操作后得到维度为1×1×h的特征向量;

调用Concat函数和Reshape函数将所述局部判别网络D_loc输出的特征向量和所述全局判别网络D_glo输出的特征向量进行连接并调整成维度为1×2h的特征向量,再经过一个全连接层处理后得到一个输出值,然后使用sigmod函数将所述输出值映射到[0,1]范围内,从而得到映射后的值,用于判断所述合成图像si的真假;

步骤2.6、采用如式(4)所示的最小二乘损失函数来建立双判别网络的损失函数L(D):

步骤2.7、利用式(5)构建双判别网络的总损失Ls(D):

Ls(D)=L(D_loc)+L(D_glo) (5)

式(5)中,L(D_loc)表示局部判别网络D_loc的损失函数,L(D_glo)表示全局判别网络D_glo的损失函数;

步骤2.8、利用式(6)构建全局目标函数Lall

Lall=Ls(G)+Ls(D) (6)

步骤2.9、基于所述全局目标函数Lall,采用预处理后的人脸图像数据集X对所述改进深度卷积生成对抗网络进行训练,直到双判别网络无法判断输入图像的真假时,得到最优网络模型,并输出合成人脸图像S={s′1,s′2,...,s′i,...,s′N};其中,s′i表示第i张人脸图像xi输出的最优合成图像;

步骤3、构建表情分类网络,并使用带表情标签的人脸表情数据集进行训练:

步骤3.1、获取带表情标签的人脸表情图像数据集并分别裁剪成尺寸M×M的表情图像,得到裁剪后的表情数据集记为Y={y1,y2,...,yj,...,yT},其中,yj表示第j张裁剪后的表情图像,j=1,2,...,T,T为裁剪后的数据集中图像的总数;

步骤3.2、构建由K个卷积层和v个全连接层构成的表情分类网络;

其中,K个卷积层中的前k个卷积层后设置有平均池化层,后K-k个卷积层后设置最大池化层;各个全连接层之间设置有dropout层;

将维度为M×M的第j张裁剪后的表情图像yj输入所述表情分类网络中并输出F个预测值{Rj,1,Rj,2,...,Rj,t,...,Rj,F};其中,Rj,t表示第j张裁剪后的表情图像yj输出的第t个预测值;

将F个预测值{Rj,1,Rj,2,...,Rj,t,...,Rj,F}输入Softmax分类器中转换为对应的概率分布{Qj,1,Qj,2,...,Qj,t,...,Qj,F};其中,Qj,t表示第t个预测值Rj,t的概率分布;

选取概率分布{Qj,1,Qj,2,...,Qj,t,...,Qj,F}中最大值所对应的表情标签作为第j张裁剪后的表情图像yj的人脸表情识别结果;

步骤4、将改进深度卷积生成对抗网络输出的合成人脸图像S={s′1,s′2,...,s′i,...,s′N}与预处理后的人脸图像数据集X={x1,x2,...,xi,...,xN}进行融合后作为训练后的表情分类网络的输入,并由所述训练后的表情分类网络输出分类结果,并将分类结果作为预处理后的人脸图像数据集X={x1,x2,...,xi,...,xN}的人脸表情识别结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111158933.X/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top