[发明专利]一种基于深度学习的多模态人脸识别方法有效

专利信息
申请号: 201710122193.1 申请日: 2017-03-02
公开(公告)号: CN106909905B 公开(公告)日: 2020-02-14
发明(设计)人: 张浩;韩琥;山世光;陈熙霖 申请(专利权)人: 中科视拓(北京)科技有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 100086 北京市海淀区科*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于深度学习的多模态人脸识别方法,包括(1)对RGB人脸图像进行人脸检测和对齐,根据模态之间的映射关系裁切制作RGB模态和其他模态的人脸数据集S0,S1,S2……;(2)设计一个多模态融合的深度卷积神经网络结构N1,并训练N1网络;(3)设计一个多模态共享的深度卷积神经网络结构N2,并训练N2网络;(4)提取特征阶段、(5)相似度计算阶段和(6)相似度融合阶段。本发明采用多模态系统,通过进行多种人脸模态数据的采集,利用多种模态信息各自的优点,通过融合策略来克服单模态系统的某些内在弱点,同时充分的利用多种模态信息,有效地提升了人脸识别系统的性能,使得人脸识别更加快捷准确。
搜索关键词: 一种 基于 深度 学习 多模态人脸 识别 方法
【主权项】:
1.一种基于深度学习的多模态人脸识别方法,其特征在于,包括以下步骤:/n(1)对RGB人脸图像进行人脸检测,特征点定位,对齐,裁切,制作裁切后的RGB模态人脸数据集S0;根据RGB模态和其他模态之间的坐标映射关系,找到其他模态人脸的特征点,并裁切制作其他模态的人脸数据集S1,S2……;/n(2)设计一个多模态融合的深度卷积神经网络结构N1,在这个结构中,前半部分是几个独立的神经网络分支,每个分支的输入对应一个模态,然后用特定的网络结构把多个模态分支融合成一个分支,再连接一系列神经网络结构单元;然后将S0,S1,S2……送入到N1的对应分支中,训练N1网络,训练好的模型用M1来表示;/n上述模态包括但不限于RGB模态、深度模态和近红外模态;特定的网络结构中,每个分支有各自的分类损失作为各个模态各自的监督信号,结构融合方法采用特征拼接;/n(3)设计一个多模态共享的深度卷积神经网络结构N2,将S0,S1,S2……不加区分的一起送入N2中,训练N2网络,训练好的模型用M2来表示;/n(4)提取特征阶段,对于注册集和查询集的图像,其模态范围在训练集模态范围内,某图像的不同模态可以表示为I0,I1,I2……,然后把I0,I1,I2……分别在模型M1和M2上提取特征,特征可用F0,F0C,F1,F1C,F2,F2C……表示,C表示是从M2上提取的特征;/n(5)分别计算GF0和PF0之间的相似度S00,GF1和PF1的相似度S11,GF2和PF2的相似度S22;计算GF0C和PF1C之间的相似度S01,类似的计算出跨模态相似度S02,S03,S12,S13,S23……;/n上述GF0表示注册集图像的F0,PF0表示查询集图像的F0,GF0C表示注册集图像的F0C,PF1C表示查询集图像的F1C;/n(6)对所有的注册集和查询集相似度进行加权求和融合,得到最终的融合相似度S,在融合相似度S构成的相似度矩阵上进行人脸识别和人脸确认。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科视拓(北京)科技有限公司,未经中科视拓(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710122193.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top