[发明专利]一种智能人脸识别方法有效
申请号: | 202110101590.7 | 申请日: | 2021-01-26 |
公开(公告)号: | CN112800937B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 李弘;肖南峰 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/44;G06V10/82;G06N3/04;G06N3/08;G06F21/32 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 识别 方法 | ||
1.一种智能人脸识别方法,其特征在于,包括以下步骤:
1)人脸检测:从原始图片中截取出以人面部为主要内容的源姿态人脸图片;
2)人脸对齐:识别并定位源姿态人脸图片中的人脸关键点;
3)人脸姿态旋转:根据源姿态人脸图片和选定姿态,保留其身份信息和表情信息,转换生成具有视觉真实感的目标姿态人脸图片;
4)人脸表情与身份识别:结合源姿态人脸图片与目标姿态人脸图片,判断图片中人脸的表情与身份;
使用融合注意力机制的生成对抗网络AFGAN识别人脸表情,识别过程中采用基于人脸关键点的注意力机制;
AFGAN的网络结构基础为CGAN,包含1个生成器G与2个判别器Dii、Dih及身份特征提取器Dip;生成器G输入源姿态人脸图片与目标姿态关键点热图,以关键点热图作为姿态条件信息,输出合成的目标姿态图片;判别器Dii输入源姿态人脸图片与真实或合成的目标姿态人脸图片,判别器Dih输入真实或合成的目标姿态人脸图片与目标姿态关键点热图,均输出真实性标签与表情标签;判别器Dii与身份特征提取器Dip的结构一致,身份特征提取器Dip为LightCNN模型,将提取出来的身份特征向量,用于维持旋转前后的身份信息一致性以及身份识别任务;
AFGAN中用于训练判别器Dii与Dih的损失函数包括条件对抗损失与表情识别损失;其中,条件对抗损失保证判别器区分真实与合成人脸图片的能力,表情识别损失保证判别器识别人脸表情的能力;
使用AFGAN中的2个判别器Dii与Dih来检验合成图片的真实性与识别人脸表情;基于人脸关键点的注意力机制,将待识别人脸图片与对应的注意力热图数乘,生成注意力子图,形式化定义为:
x=It+Ht, x1 = (Is*Hs1)+Ht1, x2 = (Is*Hs2)+Ht2
其中,It为待识别人脸图片,即真实或合成的目标姿态图片,Hs1、Hs2分别为源姿态的眼部与口部注意力热图,Ht1、Ht2分别为目标姿态的眼部与口部关键点热图,*表示元素级数乘操作,+表示矩阵的连接操作,x、x1、x2分别为主通道、眼部注意力子通道、口部注意力子通道的输入;
判别器Dih分别处理主通道与两个注意力子通道的输入,将三个通道的特征输出进行连接融合,形式化定义为:
D2(x,x1,x2) = Linear(D1(x)+D1(x1)+D1(x2))
其中,D2 (x,x1,x2)为判别器Dih公共特征提取阶段的最终输出,D1 (x)、D1 (x1)、D1 (x2)分别为主通道、眼部注意力子通道、口部注意力子通道的公共特征输出, Linear()表示线性组合;
融合后的公共特征分别进入判别器Dih的两个输出分支,获得待识别人脸图片的真实度特征矩阵与表情预测特征向量,形式化定义为:
Exp=D3(D2(x,x1,x2)), Gan=D4(D2(x,x1,x2))
其中,D3()为表情输出分支,Exp为表情预测特征向量,D4()为图片真实度输出分支,Gan为图片真实度特征矩阵;
判别器Dii的处理方式相比Dih,仅将Ht替换为源姿态人脸图片Is,其余保持一致。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110101590.7/1.html,转载请声明来源钻瓜专利网。