[发明专利]一种基于增量学习人脸分块视觉表征的视频人脸识别方法有效
申请号: | 201310214506.8 | 申请日: | 2013-05-31 |
公开(公告)号: | CN103279768B | 公开(公告)日: | 2018-02-06 |
发明(设计)人: | 张兆翔;王超;王蕴红 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06K9/66 | 分类号: | G06K9/66;G06K9/46 |
代理公司: | 北京永创新实专利事务所11121 | 代理人: | 周长琪 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于增量学习人脸分块视觉表征的视频人脸识别方法,属于模式识别领域。本方法使用Adaboost算法在人脸视频第一帧的正面人脸图像进行检测,使用Camshift算法进行跟踪,得到所有人脸图像,在读入视频过程中,对人脸图像进行增量聚类,并从每类人脸图像中选取代表;对代表图像进行处理,学习基于块视觉表征的视觉词典;使用视觉词典对人脸图像进行表征;最后根据相似矩阵对人脸图像构成的视频进行识别。本发明方法能够提高视频人脸在光照、姿态,以及跟踪结果不理想状态下的识别率和鲁棒性,能够有效、便捷、自动地检测、跟踪和识别视频中的人脸。 | ||
搜索关键词: | 一种 基于 增量 学习 分块 视觉 表征 视频 识别 方法 | ||
【主权项】:
一种基于增量学习人脸分块视觉表征的视频人脸识别方法,其特征在于,包括如下步骤:步骤S1:对读入的一段时间的人脸图像序列,使用Adaboost算法对第一帧的正面人脸图像进行检测,得到目标人脸,使用Camshift算法对人脸图像序列进行处理,跟踪得到所有人脸图像;步骤S2:在读入人脸图像序列的过程中,对通过人脸目标检测和人脸运动跟踪获得的人脸图像进行增量聚类;步骤S3:增量聚类过程中,对增量聚类得到的每一类人脸图像中,选取该类的代表;步骤S4:将所有选出的人脸图像都进行矩形块分割;步骤S5:对人脸图像分割的每个矩形块提取特征向量;步骤S6:对提取出来的所有特征向量,使用vector quantization算法进行分类,学习人脸视觉词汇,将学习到的所有视觉词汇统计起来,形成人脸视觉词汇词典;步骤S7:通过空间金字塔匹配方法,使用人脸视觉词汇对人脸图像进行表征,人脸图像表示为由人脸视觉词汇表示的直方图;在训练阶段,将训练视频集中选取的作为代表的人脸图像都使用人脸视觉词汇表征;在识别阶段,将测试视频中的每帧测试图像都经过步骤S4到步骤S7的处理,用人脸视觉词汇表征;步骤S8:通过时序相似矩阵对测试视频的每帧人脸图像进行识别,实现方法为:步骤8.1:对测试视频中每帧测试图像,计算该测试图像用人脸视觉词汇表示的特征,到训练视频集中各代表人脸图像用人脸视觉词汇表示的特征的余弦相似距离,得到相似距离矩阵;测试图像特征ft到训练视频集中第j个人第k个类代表人脸图像特征fkj的余弦相似距离dkj为:dkj=ρ(ft,fkj),k=1,...,Cj,其中,Cj为第j个人的类代表的个数,ρ表示余弦相似距离计算,步骤S8中所述的图像特征是指图像用人脸视觉词汇表示的特征;步骤8.2:通过相似距离矩阵,确定测试图像与训练视频集中每个人的相似距离,对相似距离赋予权重,得到测试图像与第j个人的身份得分;测试图像与训练视频集中第j个人的相似距离sj为:sj=1Cj-2(Σk=1Cjdkj-maxk(dkj)-mink(dkj));]]>其中,表示测试图像特征到训练视频集中第j个人所有类代表人脸图像特征的余弦相似距离的最大值,表示测试图像特征距离训练视频集中第j个人所有类代表人脸图像特征的余弦相似距离的最小值;对相似距离sj赋予权重Wj,得到测试图像与第j个人的身份得分scorej:scorej=α(Wjsj‑β),j=1,2,…,G;其中,G为训练数据库中人的个数;α和β为对得分进行归一化的参数,表示为:α=1maxj(sj)-minj(sj),β=minj(sj);]]>其中,表示测试图像与训练集中G个人的相似距离的最大值,表示测试图像与训练集中G个人的相似距离的最小值;权重Wj为:其中,NbCj表示测试图像与训练视频集中第j个人的相似距离的有效个数,表示中的最大值,表示中的最小值;NbCj通过下面公式计算得到:NbCj=Σk=1Cjωkj,ωkj=1,dkj>Confidence0,dkj≤Confidence]]>ωkj为参数,当余弦相似距离大于Confidence时,取1,否则取零;Confidence为预先设定的值,用于取舍相似余弦距离;步骤8.3:得到测试图像与所有训练视频集中的人的身份得分后,取最大的身份得分对应的人作为该测试图像中待识别人脸的身份;当一张测试图像确定为第c个人时,对第c个人投一票,当一段测试视频中的每张测试图像都进行步骤8.1~8.3后,将得票最多的那个人作为该段测试视频中待识别人脸的身份。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310214506.8/,转载请声明来源钻瓜专利网。
- 上一篇:充气轮胎的制造方法
- 下一篇:一种基于2跳段的光组播静态P圈段保护方法