[发明专利]基于姿态分离生成对抗网络的人物识别方法在审
申请号: | 202111031786.X | 申请日: | 2021-09-03 |
公开(公告)号: | CN113850152A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 唐胜;万大千;曹娟;李锦涛 | 申请(专利权)人: | 北京中科睿鉴科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 杭州九洲专利事务所有限公司 33101 | 代理人: | 沈敏强 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 姿态 分离 生成 对抗 网络 人物 识别 方法 | ||
本发明涉及一种基于姿态分离生成对抗网络的人物识别方法。适用于深度学习和计算机视觉领域。本发明所采用的技术方案是:一种基于姿态分离生成对抗网络的人物识别方法,其特征在于:将人物图像输入姿态分离生成对抗网络,提取人物图像中人物的人脸身份特征,该人脸身份特征提取至人物图像中人物的正脸图像或基于人物图像中人物的非正脸图像生成的正脸图像;利用人脸识别算法对所述姿态分离生成对抗网络提取的人脸身份特征进行人物识别;所述姿态分离生成对抗网络包括生成器和判别器。本发明中姿态分离生成对抗网络通过提取分离姿态信息的人脸身份特征提高侧脸识别的准确率,进而降低人物识别中非正脸人物图像的漏检率。
技术领域
本发明涉及一种基于姿态分离生成对抗网络的人物识别方法。适用于深度学习和计算机视觉领域。
背景技术
随着互联网和通信技术飞速发展,网络中传播的内容也不再只局限于文字,以图像形式存在的信息数量呈指数增长,例如微博日均的图片量约900万张。在当今开放的互联网环境下,人物图像被大肆传播,从海量的互联网图像数据中有效寻找出人们所关注人物的图像,已成为人们的迫切要求。上述需求在舆情监控、天网系统等方面都具有广泛的应用价值。
人物识别是一种在数字图像或视频中确定人物身份的技术,因此该技术成为从互联网图像中寻找某人物图像的关键。Abdalrazig等和Prasad等指出人脸是人类身份认证中最突出的生物特征之一,具有出色的人类个体差异性,并且在大多数条件下保持稳定,因此人脸识别技术是进行人物识别的主流方法。
但是,目前的人脸识别算法都是在正脸图像基础上开发的。利用现有人脸识别技术对互联网人物图像进行识别时,由于互联网人物图像中人脸姿态多样化,模型从非正脸人物图像提取的特征包含了姿态信息,这会对人脸识别结果造成干扰,进而导致非正脸人物漏检率高的问题。
发明内容
本发明要解决的技术问题是:针对上述存在的问题,提供一种基于姿态分离生成对抗网络的人物识别方法。
本发明所采用的技术方案是:一种基于姿态分离生成对抗网络的人物识别方法,其特征在于:
将人物图像输入姿态分离生成对抗网络,提取人物图像中人物的人脸身份特征,该人脸身份特征提取至人物图像中人物的正脸图像或基于人物图像中人物的非正脸图像生成的正脸图像;
利用人脸识别算法对所述姿态分离生成对抗网络提取的人脸身份特征进行人物识别;
所述姿态分离生成对抗网络包括生成器和判别器;
其中,所述生成器包括:
编码器,用于提取人物图像中的人脸特征,并将人脸特征拆分为人脸身份特征和人脸姿态特征;
解码器,用于根据所述解码器提取的人脸身份特征生成相应的正脸图像;
所述判别器,用于完成数据真伪分类任务和基于人脸姿态特征的正侧脸分类任务,正侧脸分类任务使判别器和生成器之间形成对抗性,迫使解码器生成正脸图像。
所述编码器的网络结构采用卷积神经网络,包含14个卷积层和2个全连接层,每个卷积层使用尺寸为3×3的卷积核;
所述解码器的网络结构采用了反卷积神经网络,包含14个反卷积层;
编码器和解码器网络参数使用均值为0,方差为0.02的正态分布进行初始化;
所述判别器的网络结构采用卷积神经网络,包含14个卷积层和2个全连接层,每个卷积层使用尺寸为3×3的卷积核;判别器的网络参数使用均值为0,方差为0.02的正态分布进行初始化。
生成器G为使判别器D将合成样本分类为真实和正脸样本所使用的损失函数如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科睿鉴科技有限公司,未经北京中科睿鉴科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111031786.X/2.html,转载请声明来源钻瓜专利网。