[发明专利]一种基于改进深度卷积生成对抗网络的人脸表情识别方法有效
申请号: | 202111158933.X | 申请日: | 2021-09-30 |
公开(公告)号: | CN113688799B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 史明光;陶玉兰 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/774;G06V10/764;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 深度 卷积 生成 对抗 网络 表情 识别 方法 | ||
1.一种基于改进深度卷积生成对抗网络的人脸表情识别方法,其特征在于,包括以下步骤:
步骤1、获取人脸图像数据集并进行预处理:
获取真实人脸图像数据集并分别裁剪成尺寸为M×M的人脸图像,再对裁剪后的人脸图像随机添加的掩码,得到预处理后的人脸图像数据集记为X={x1,x2,...,xi,...,xN},其中,xi表示第i张人脸图像,i=1,2,...,N,N为人脸图像数据集中人脸图像的总数;
步骤2、构建生成网络G和双判别网络组成的改进深度卷积生成对抗网络:
步骤2.1、构建包括编码器和解码器组成的生成网络G;
所述编码器包括m层卷积层,所述解码器包括m层反卷积层;
设置所有卷积层的步长为2c、反卷积层的步长设为c;
设置卷积层的激活函数采用LeakyRelu函数,反卷积层的激活函数采用Relu函数;
在所述编码器的第1层卷积层与所述解码器的第m层反卷积层之间加入跳跃连接;在所述编码器的第2层卷积层与所述解码器的第m-1层反卷积层之间加入跳跃连接;依次类推,在所述编码器的第m层卷积层与所述解码器的第1层反卷积层之间加入跳跃连接;且每层卷积层和每层反卷积层后均设置有Padding操作;
所述第i张人脸图像xi经过所述生成网络G的编码和解码处理后得到维度为M×M的合成图像si;
步骤2.2、建立如式(1)所示的重构损失Lrec:
Lrec=||si-xi|| (1)
步骤2.3、采用如式(2)所示的最小二乘损失函数来建立生成网络G的损失函数L(G):
式(2)中,E表示数学期望,xi~pxi表示第i张人脸图像xi服从数据集中的人脸图像分布;D(si)表示双判别网络对合成图像si的预测值;
步骤2.4、利用式(3)构建生成网络G的总损失Ls(G):
Ls(G)=Lrec+L(G) (3)
步骤2.5、构建包括局部判别网络D_loc和全局判别网络D_glo的双判别网络:
所述局部判别网络D_loc是由w层卷积神经网络构成,且每个卷积层后采用Leaky Relu函数作为激活函数;
将所述维度为M×M的合成图像si中维度为的局部人脸图像输入所述局部判别网络D_loc中,并经过卷积操作后得到维度为1×1×h的特征向量;
所述全局判别网络D_glo是由w+1层卷积神经网络构成,且每个卷积层后采用LeakyRelu函数作为激活函数;
将所述维度为M×M的合成图像si输入所述全局判别网络D_glo中,并经过卷积操作后得到维度为1×1×h的特征向量;
调用Concat函数和Reshape函数将所述局部判别网络D_loc输出的特征向量和所述全局判别网络D_glo输出的特征向量进行连接并调整成维度为1×2h的特征向量,再经过一个全连接层处理后得到一个输出值,然后使用sigmod函数将所述输出值映射到[0,1]范围内,从而得到映射后的值,用于判断所述合成图像si的真假;
步骤2.6、采用如式(4)所示的最小二乘损失函数来建立双判别网络的损失函数L(D):
步骤2.7、利用式(5)构建双判别网络的总损失Ls(D):
Ls(D)=L(D_loc)+L(D_glo) (5)
式(5)中,L(D_loc)表示局部判别网络D_loc的损失函数,L(D_glo)表示全局判别网络D_glo的损失函数;
步骤2.8、利用式(6)构建全局目标函数Lall:
Lall=Ls(G)+Ls(D) (6)
步骤2.9、基于所述全局目标函数Lall,采用预处理后的人脸图像数据集X对所述改进深度卷积生成对抗网络进行训练,直到双判别网络无法判断输入图像的真假时,得到最优网络模型,并输出合成人脸图像S={s′1,s′2,...,s′i,...,s′N};其中,s′i表示第i张人脸图像xi输出的最优合成图像;
步骤3、构建表情分类网络,并使用带表情标签的人脸表情数据集进行训练:
步骤3.1、获取带表情标签的人脸表情图像数据集并分别裁剪成尺寸M×M的表情图像,得到裁剪后的表情数据集记为Y={y1,y2,...,yj,...,yT},其中,yj表示第j张裁剪后的表情图像,j=1,2,...,T,T为裁剪后的数据集中图像的总数;
步骤3.2、构建由K个卷积层和v个全连接层构成的表情分类网络;
其中,K个卷积层中的前k个卷积层后设置有平均池化层,后K-k个卷积层后设置最大池化层;各个全连接层之间设置有dropout层;
将维度为M×M的第j张裁剪后的表情图像yj输入所述表情分类网络中并输出F个预测值{Rj,1,Rj,2,...,Rj,t,...,Rj,F};其中,Rj,t表示第j张裁剪后的表情图像yj输出的第t个预测值;
将F个预测值{Rj,1,Rj,2,...,Rj,t,...,Rj,F}输入Softmax分类器中转换为对应的概率分布{Qj,1,Qj,2,...,Qj,t,...,Qj,F};其中,Qj,t表示第t个预测值Rj,t的概率分布;
选取概率分布{Qj,1,Qj,2,...,Qj,t,...,Qj,F}中最大值所对应的表情标签作为第j张裁剪后的表情图像yj的人脸表情识别结果;
步骤4、将改进深度卷积生成对抗网络输出的合成人脸图像S={s′1,s′2,...,s′i,...,s′N}与预处理后的人脸图像数据集X={x1,x2,...,xi,...,xN}进行融合后作为训练后的表情分类网络的输入,并由所述训练后的表情分类网络输出分类结果,并将分类结果作为预处理后的人脸图像数据集X={x1,x2,...,xi,...,xN}的人脸表情识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111158933.X/1.html,转载请声明来源钻瓜专利网。