[发明专利]基于卷积神经网络的人脸识别方法有效

专利信息
申请号: 201410620574.9 申请日: 2014-11-06
公开(公告)号: CN104346607B 公开(公告)日: 2017-12-22
发明(设计)人: 胡静 申请(专利权)人: 上海电机学院
主分类号: G06K9/00 分类号: G06K9/00;G06K9/46;G06K9/66
代理公司: 上海思微知识产权代理事务所(普通合伙)31237 代理人: 郑玮
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 卷积 神经网络 识别 方法
【说明书】:

技术领域

发明涉及一种基于卷积神经网络的人脸识别方法。

背景技术

人脸识别技术是利用计算机分析人脸图像,提取有效的特征信息,识别个人身份的技术。它首先判断图像中是否存在人脸?如果存在则进一步确定每张人脸的位置、大小信息。并依据这些信息进一步提取每张人脸中潜在的模式特征,将其与已知人脸库中的人脸进行对比,从而识别每张人脸的类别信息。其中,判断一幅图像中是否存在人脸的过程就是人脸检测,将提取特征后的图像与已知人脸库对比的过程就是人脸识别。

近几年研究者在人脸检测与人脸识别方面取得了大量成果,在检测性能和识别性能上都有很大提高。近几年,大量的人脸检测算法被提出,这些算法大致可以分为3类:(1)基于肤色特征的方法,(2)基于知识模型的方法,(3)基于统计理论的方法。其中,人工神经网络(ANN)方法通过训练一个网络结构,把模式的统计特性隐含在网络结构和参数之中,对于人脸这类复杂的、难以显式描述的模式,基于ANN的方法具有独特的优势,Rowiey使用了两层ANN检测多姿态的人脸,第一层用来估计输入图像窗口的人脸姿态,第二层为三个人脸检测器,分别用来检测正面人脸、半侧面人脸、侧面人脸。一幅输入图像首先经过人脸姿态检测器估计其人脸姿态,对图像进行相应的预处理后,将其作为第二层的三个人脸检测器,最终确定人脸的位置以及姿态。

人脸识别大致可分为以下几类方法:(1)基于几何特征的方法;(2)基于弹性模型匹配方法;(3)神经网络方法;(4)基于线性和非线性子空间的方法。目前,存在的很多算法对场景简单的人脸图像具有很好的识别效果,然而在视频监控领域,视频图像受光照,方位,噪声和不同的人脸及表情等影响,即使目前高性能的人脸识别算法在这样的条件下仍不能达到非常理想的识别结果。

人脸识别的困难具体体现在如下几个方面:

(1)相机的成像角度,即姿态对大部分人脸识别算法都有很大的影响,特别是基于简单几何特征的算法。两张属于同一个人的人脸图像由于姿态的影响可能会造成这两张图像的相似度还不如两张属于不同人的图像。

(2)光照的变化会改变人脸图像灰度信息,对于一些基于灰度特征的识别算法影响很大。

(3)表情的变化也会造成识别性能的下降。

(4)人脸图像还可能受到年龄,遮挡以及人脸图像尺度等因素的影响,会在不同程度上影响人脸识别算法的性能。

卷积神经网络是近年发展起来,并引起广泛重视的一种高效识别方法。20世纪60年代,Hubel和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现其独特的网络结构可以有效地降低反馈神经网络的复杂性,继而提出了卷积神经网络(Convolutional Neural Networks-简称CNN)。现在,CNN已经成为众多科学领域的研究热点之一,特别是在模式分类领域,由于该网络避免了对图像的复杂前期预处理,可以直接输入原始图像,因而得到了更为广泛的应用。K.Fukushima在1980年提出的新识别机是卷积神经网络的第一个实现网络。随后,更多的科研工作者对该网络进行了改进。其中,具有代表性的研究成果是Alexander和Taylor提出的“改进认知机”,该方法综合了各种改进方法的优点并避免了耗时的误差反向传播。

一般地,CNN的基本结构包括二层,其一为特征提取层,每个神经元的输入与前一层的局部接受域相连,并提取该局部的特征。一旦该局部特征被提取后,它与其他特征间的位置关系也随之确定下来;其二是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数,使得特征映射具有位移不变性。此外,由于一个映射面上的神经元共享权值,因而减少了网络自由参数的个数。卷积神经网络中的每一个卷积层都紧跟着一个用来求局部平均与二次提取的计算层,这种特有的两次特征提取结构减小了特征分辨率。

CNN主要用来识别位移、缩放及其他形式扭曲不变性的二维图形。由于CNN的特征检测层通过训练数据进行学习,所以在使用CNN时,避免了显示的特征抽取,而隐式地从训练数据中进行学习;再者由于同一特征映射面上的神经元权值相同,所以网络可以并行学习,这也是卷积网络相对于神经元彼此相连网络的一大优势。卷积神经网络以其局部权值共享的特殊结构在语音识别和图像处理方面有着独特的优越性,其布局更接近于实际的生物神经网络,权值共享降低了网络的复杂性,特别是多维输入向量的图像可以直接输入网络这一特点避免了特征提取和分类过程中数据重建的复杂度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电机学院,未经上海电机学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410620574.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top