[发明专利]一种基于增量学习人脸分块视觉表征的视频人脸识别方法有效

申请号：	201310214506.8	申请日：	2013-05-31
公开（公告）号：	CN103279768B	公开（公告）日：	2018-02-06
发明（设计）人：	张兆翔;王超;王蕴红	申请（专利权）人：	北京航空航天大学
主分类号：	G06K9/66	分类号：	G06K9/66;G06K9/46
代理公司：	北京永创新实专利事务所11121	代理人：	周长琪
地址：	100191***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种基于增量学习人脸分块视觉表征的视频人脸识别方法，属于模式识别领域。本方法使用Adaboost算法在人脸视频第一帧的正面人脸图像进行检测，使用Camshift算法进行跟踪，得到所有人脸图像，在读入视频过程中，对人脸图像进行增量聚类，并从每类人脸图像中选取代表；对代表图像进行处理，学习基于块视觉表征的视觉词典；使用视觉词典对人脸图像进行表征；最后根据相似矩阵对人脸图像构成的视频进行识别。本发明方法能够提高视频人脸在光照、姿态，以及跟踪结果不理想状态下的识别率和鲁棒性，能够有效、便捷、自动地检测、跟踪和识别视频中的人脸。
搜索关键词：	一种基于增量学习分块视觉表征视频识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于增量学习人脸分块视觉表征的视频人脸识别方法，其特征在于，包括如下步骤：步骤S1：对读入的一段时间的人脸图像序列，使用Adaboost算法对第一帧的正面人脸图像进行检测，得到目标人脸，使用Camshift算法对人脸图像序列进行处理，跟踪得到所有人脸图像；步骤S2：在读入人脸图像序列的过程中，对通过人脸目标检测和人脸运动跟踪获得的人脸图像进行增量聚类；步骤S3：增量聚类过程中，对增量聚类得到的每一类人脸图像中，选取该类的代表；步骤S4：将所有选出的人脸图像都进行矩形块分割；步骤S5：对人脸图像分割的每个矩形块提取特征向量；步骤S6：对提取出来的所有特征向量，使用vector quantization算法进行分类，学习人脸视觉词汇，将学习到的所有视觉词汇统计起来，形成人脸视觉词汇词典；步骤S7：通过空间金字塔匹配方法，使用人脸视觉词汇对人脸图像进行表征，人脸图像表示为由人脸视觉词汇表示的直方图；在训练阶段，将训练视频集中选取的作为代表的人脸图像都使用人脸视觉词汇表征；在识别阶段，将测试视频中的每帧测试图像都经过步骤S4到步骤S7的处理，用人脸视觉词汇表征；步骤S8：通过时序相似矩阵对测试视频的每帧人脸图像进行识别，实现方法为：步骤8.1：对测试视频中每帧测试图像，计算该测试图像用人脸视觉词汇表示的特征，到训练视频集中各代表人脸图像用人脸视觉词汇表示的特征的余弦相似距离，得到相似距离矩阵；测试图像特征ft到训练视频集中第j个人第k个类代表人脸图像特征fkj的余弦相似距离dkj为：dkj＝ρ(ft,fkj),k＝1,...,Cj，其中，Cj为第j个人的类代表的个数，ρ表示余弦相似距离计算，步骤S8中所述的图像特征是指图像用人脸视觉词汇表示的特征；步骤8.2：通过相似距离矩阵，确定测试图像与训练视频集中每个人的相似距离，对相似距离赋予权重，得到测试图像与第j个人的身份得分；测试图像与训练视频集中第j个人的相似距离sj为：sj=1Cj-2(Σk=1Cjdkj-maxk(dkj)-mink(dkj));]]>其中，表示测试图像特征到训练视频集中第j个人所有类代表人脸图像特征的余弦相似距离的最大值，表示测试图像特征距离训练视频集中第j个人所有类代表人脸图像特征的余弦相似距离的最小值；对相似距离sj赋予权重Wj，得到测试图像与第j个人的身份得分scorej：scorej＝α(Wjsj‑β)，j＝1,2,…,G；其中，G为训练数据库中人的个数；α和β为对得分进行归一化的参数，表示为：α=1maxj(sj)-minj(sj),β=minj(sj);]]>其中，表示测试图像与训练集中G个人的相似距离的最大值，表示测试图像与训练集中G个人的相似距离的最小值；权重Wj为：其中，NbCj表示测试图像与训练视频集中第j个人的相似距离的有效个数，表示中的最大值，表示中的最小值；NbCj通过下面公式计算得到：NbCj=Σk=1Cjωkj,ωkj=1,dkj>Confidence0,dkj≤Confidence]]>ωkj为参数，当余弦相似距离大于Confidence时，取1，否则取零；Confidence为预先设定的值，用于取舍相似余弦距离；步骤8.3：得到测试图像与所有训练视频集中的人的身份得分后，取最大的身份得分对应的人作为该测试图像中待识别人脸的身份；当一张测试图像确定为第c个人时，对第c个人投一票，当一段测试视频中的每张测试图像都进行步骤8.1～8.3后，将得票最多的那个人作为该段测试视频中待识别人脸的身份。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京航空航天大学，未经北京航空航天大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201310214506.8/，转载请声明来源钻瓜专利网。

上一篇：充气轮胎的制造方法
下一篇：一种基于2跳段的光组播静态P圈段保护方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于增量学习人脸分块视觉表征的视频人脸识别方法有效

专利文献下载