[发明专利]一种基于双重限制注意力神经网络模型的人脸识别方法在审
申请号: | 201910017927.9 | 申请日: | 2019-01-09 |
公开(公告)号: | CN109447053A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 阚伟伟;王佩旭;吴明明;殷雄;吴祚煜 | 申请(专利权)人: | 江苏星云网格信息技术有限公司;南通星云智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 226000 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络模型 人脸 双重限制 矩阵 原始人脸图像 注意力 人脸识别 人脸特征 人脸特征提取 人脸模板库 摄像头 比对识别 人脸图像 特征提取 图像输入 五官 正脸 切割 图像 | ||
本发明主要提供了一种基于双重限制注意力神经网络模型的人脸识别方法,包括如下内容:利用摄像头获取原始人脸图像;将原始人脸图像输入到MTCNN神经网络模型中,得到经过五官人脸切割后的人脸脸框图像;将人脸正脸脸框图像输入双重限制注意力神经网络模型中,利用多级特征提取方法进行人脸特征提取,得到人脸特征矩阵;以人脸特征矩阵与人脸模板库中的人脸图像进行比对识别得到人脸结果。
技术领域:
本发明涉及图像处理识别技术,尤其涉及一种基于双重限制注意力神经网络模型的人脸识别方法。
背景技术:
在现代社会中,个人身份认证技术的应用无所不在,其中基于指纹、虹膜、以及人脸等人体生物特征的识别技术在多个领域有巨大的市场需求,例如:门禁系统、视频监控、机场安检、以及智能空间等。尽管基于指纹和虹膜的身份认证比人脸识别技术具有更高的准确性和可靠性,但人脸识别因具有自然、友好、对用户干扰少、易被用户接受等优势而有更广阔的应用前景。
人脸识别是基于数字图像处理、计算机视觉和机器学习等技术,借助于计算机处理技术,对数据库中人脸图像进行分析比较的过程。目前,人脸识别的方法主要是通过反复卷积操作来完成识别,和一般的图像分类任务处理方法一样,只考虑到图像中外在特征的提取,而没有考虑到各个特征之间的内在联系。
注意力机制一直是自然语言处理领域非常出名的机制,通过注意力机制可以有效的提取出文字上下文的深层含义,将注意力机制引入图像处理领域一直是一个非常热门的研究,但具体如何将注意力机制应用到人脸识别上还有待研究。
发明内容:
为了解决上述问题,本发明提供一种基于双重限制注意力神经网络模型的人脸识别方法,通过将注意力机制引入神经网络模型中,大大提高人脸图像上的轮廓以及五官信息的提取,使得模型具备特征分类能力,提高模型的识别准确率。
为达到上述目的,本发明的技术方案是:一种基于双重限制注意力神经网络模型的人脸识别方法,包括如下步骤:
步骤1)、利用摄像头获取原始人脸图像;
步骤2)、将原始人脸图像输入到MTCNN神经网络模型中,得到经过五官人脸切割后的人脸脸框图像;
步骤3)、将人脸正脸脸框图像输入双重限制注意力神经网络模型中,利用多级特征提取方法进行人脸特征提取,得到人脸特征矩阵;
步骤4)、以人脸特征矩阵与人脸模板库中的人脸图像进行比对识别得到人脸结果。
作为优选,所述步骤2)中利用MTCNN神经网络模型处理得到人脸脸框图像的过程包括:
步骤2-1、采用P-Net网络获得候选窗体和边界回归量,同时候选窗体根据边界框进行校准,再利用NMS方法去除重叠窗体;
步骤2-2、将P-Net网络确定的包含候选窗体的图片在R-Net网络中训练,利用边界框向量微调候选框体,再利用NMS方法去除重叠窗体;
步骤2-3、利用O-Net网络在去除候选窗体,同时显示五个人脸关键点定位。
作为优选,所述MTCNN神经网络模型的训练包括三个部分,人脸和非人脸的分类,边界框回归及五官位置点定位,其中:
人脸和非人脸的分类利用交叉熵损失函数确定:
;
其中,表示人脸概率,表示背景的真实标签,表示“预测人脸的概率”和“事实是不是人脸”的接近程度,值越小表示越接近,该部分的训练目标为获得最小值min();
边界框回归通过欧氏距离计算回归损失:
;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏星云网格信息技术有限公司;南通星云智能科技有限公司,未经江苏星云网格信息技术有限公司;南通星云智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910017927.9/2.html,转载请声明来源钻瓜专利网。