[发明专利]基于大规模图像数据的人脸特征提取方法及人脸识别方法有效
申请号: | 201210495625.0 | 申请日: | 2012-11-28 |
公开(公告)号: | CN102938065B | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 印奇;曹志敏;唐文斌;杨沐 | 申请(专利权)人: | 北京旷视科技有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/64;G06K9/00 |
代理公司: | 北京睿邦知识产权代理事务所(普通合伙)11481 | 代理人: | 徐丁峰 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 大规模 图像 数据 特征 提取 方法 识别 | ||
技术领域
本发明属于图像识别技术领域,涉及一种人脸图像分析和处理方法,尤其涉及一种基于大规模图像数据的人脸特征提取方法及人脸识别方法,可应用于人脸识别/人脸验证/人脸搜索等应用场合作为基础人脸特征提取单元。
背景技术
人脸图像的特征提取是计算机视觉研究的热点,其技术研究成果广泛应用于各种人脸识别/人脸验证/人脸搜索/人脸表情分析等任务。其基本任务是对于输入的人脸图像产生一个向量表示,使得可以很好的保留人脸身份的信息而剔除与人脸身份无关的信息。其基本目标是同一个人的人脸图像输入产生尽量相似的,彼此距离较小的向量输出,而不同人的人脸图像输入产生较为显著的差异输出。
人脸图像研究领域的研究人员提出了多种人脸特征的提取方法。
Matthew Turk和Alex Pentland在”Face Recognition Using Eigenfaces”提出了先将人脸图像像素值拉伸成的向量,然后在事先收集的一个人脸数据库上计算这些向量的主成分方向。最后新人脸图像的特征即为图像像素值向量在这些主成分方向上的投影分量。
Peter N.Belhumeur等人在“Eigenfaces vs.Fisherfaces:Recognition Using ClassSpecific Linear Projection”提出了Fisherface的特征提取方法。该方法同样使用人脸图像的像素值向量作为基本特征,使用线性判别规则提取出一组线性投影方向,最终的人脸图像特征就是在得到的那组线性投影方向上的分量。
Wiskott等人在“Face recognition by elastic bunch graph matching”中使用一组Gabor滤波器得到一些人脸的关键点的响应作为描述人脸纹理的特征。这种方法仍然是在利用图像局部的纹理特征描述人脸。
T.Ahonen等人在”Face Recognition with Local Binary Patterns”描述了这样的技术:使用局部二值化模板在图像的每个像素点做编码量化,得到一个0到255的量化值来表示这个像素点局部的灰度值结构,然后将整张人脸图像划分网格状图像片,再在每一个图像片中提取量化值的直方图,最终将所有图像片的直方图串联在一起作为人脸图像的特征。这种方法比较精细的刻画了人脸图像的局部像素灰度结构,但是对于人脸的姿态表情的变化很敏感。因此该方法主要试用于拍摄人脸处于正面,表情中性的情况。
这些经典的人脸特征提取算法,都是基于图像的局部纹理特征结构的分析表示。比如基于图像像素灰度值向量的主成分分析,基于图像像素灰度值的向量。又如Gabor分析技术只提取输入人脸在一组Gabor滤波器下的响应作为特征向量输出。再如LBP特征提取,也只是分析了输入人脸的局部像素灰度值的相对大小关系,将这种大小关系进行编码从而产生直方图输出。
由于上述人脸特征提取算法只利用了输入人脸图像的局部纹理特征,因此它们的特征提取算法受人脸图像的光照/表情以及拍摄时的人脸姿态影响很大。同一个人的人脸图像,如果拍摄时的光照/表情/姿态不同,输出的特征向量将有很大的差别,这是影响这些方法应用于人脸识别/人脸验证/人脸搜索应用的基本瓶颈。
发明内容
本发明的目的就在于克服上述经典人脸图像特征提取方法对于人脸姿态和表情的严重相关性的问题,提出一种基于大规模图像数据的人脸特征提取方法及人脸识别方法,从而得到一种更加鲁棒的适用于各种场景和应用场合的人脸图像特征。
本发明首先建立两个人脸图像数据库,即如下基于互联网图像数据建立名人人脸库和“背景”人脸库。
首先收集各种名人的姓名作为互联网人脸图像的搜索关键词,作为构建名人人脸图像数据库的基础。本发明共搜集了N个名人的检索关键词。名人人脸图像数据库中的每一人都具有多种表情、姿态、光照的大约n张人脸图片。
同时通过互联网收集不属于所收集的名人人脸图像数据库中任一个名人的人脸图像数据,构建一个作为后续训练负样本的“背景“人脸图像库,在本发明中该库的规模在M张人脸数据左右。背景人脸图像数据库中包括多种表情/姿态/光照的人脸图像。M、m、N均为自然数,其具体数字可以根据实际需要进行选取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司,未经北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210495625.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于病毒感染治疗的具有降低的毒性的膦酸酯
- 下一篇:浮动镶件模具结构
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置