[发明专利]一种图像追踪分类器的构建方法及应用其的人脸追踪方法在审

申请号：	201710503156.5	申请日：	2017-06-27
公开（公告）号：	CN107273933A	公开（公告）日：	2017-10-20
发明（设计）人：	樊应若;董远;白洪亮	申请（专利权）人：	北京飞搜科技有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06K9/00;G06T7/246
代理公司：	北京卓唐知识产权代理有限公司11541	代理人：	唐海力,韩来兵
地址：	100082 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种图像追踪分类构建方法应用
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及人脸追踪技术领域，具体涉及一种图像追踪分类器的构建方法及应用其的人脸追踪方法。

背景技术

现如今的追踪算法主要有基于传统特征的机器学习、滤波器学习等算法，但是由于提取的是HOG等传统特征，鲁棒性较差，对于光照模糊、尺寸变化等复杂场景追踪效果不佳。

现有的人脸追踪方法存在如下技术缺陷：1)目前对于人脸，深度学习用于追踪时，在线微调，计算量大，难以达到实时性的问题；2)针对光照变化、快速移动情况，传统算法效果不好的问题。

发明内容

本发明的目的提供一种加强因光照及尺寸变化等复杂场景下导致的人脸追踪方法的鲁棒性，加快人脸追踪技术的计算速度，并提高人脸追踪模型的效率。

为了实现上述目的，本发明提供了一种图像追踪分类器的构建方法，包括如下步骤：

获取用于训练的第一样本集；

构建卷积神经网络模型；

对第一样本集中每张图片进行目标框标记后，进行预处理得到第一目标区域图像和第二目标区域图像，第一目标区域图像根据目标框进行图像扩展得到，第二目标区域图像通过由第一目标区域图像和对应目标框标注图像变换得到；

利用所有的第一图像区域和第二图像区域对卷积神经网络模型进行训练，得到目标回归模型。

进一步，所述对第一样本集中每张图片进行目标框标记后，进行预处理得到第一目标区域图像和第二目标区域图像包括

利用样本集中目标框的标注，得到目标区域图像；

获取目标区域图像的中心坐标，根据中心坐标将目标区域对象进行扩展处理，得到第一目标区域图像；

对第一目标区域图像进行放缩、平移变换，得到第二目标区域图像。

进一步，第一样本集包括图片集和视频集；

其中，所述利用所有的第一图像区域和第二图像区域对卷积神经网络模型进行训练，得到得到目标回归模型还包括

判断第一样本集是否为视频集；

如果第一样本集为视频集，则获取并利用当前帧图片的第一图像区域和下一帧图片的第二图像区域对卷积神经网络模型进行训练；

如果第一样本集非视频集，则获取并利用当前图片的第一图像区域及其第二图像区域对卷积神经网络模型进行训练。

进一步，所述图像分类模型包括依次连接的5个卷积层和2个全连接层；

还包括

接收第二样本集；

对第二样本集中每张图片进行目标框标记后预处理，得到第三目标区域图像和第四目标区域图像；

固定图像分类模型中卷积层参数，利用所有的第三目标区域图像和第四对目标回归模型进行再次训练，重新调节全连接层的参数，得到图像追踪分类器。

进一步，第三目标区域图像根据第二样本集中每张图片的目标框进行图像扩展得到，第四目标区域图像通过由第三目标区域图像和对应目标框标注图像变换得到。

进一步，所述第二样本集为视频集。

本发明还提供了一种应用图像追踪分类器的人脸追踪方法，包括如下步骤：

接收人脸追踪视频集；

将人脸追踪视频集输入利用所述图像追踪分类器，在人脸追踪视频集中每张人脸图片上进行追踪预测。

在上述技术方案中，本发明利用基于深度学习的卷积神经网络提取的特征，有效解决了鲁棒性和精确度平衡的问题，同时基于caffe架构中构建的 CNN网络模型对快速移动、光照模糊变化有更强的鲁棒性，运算量小，提高了追踪的速度。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本发明所述的图像追踪分类器的构建方法一个实施例的流程示意图；

图2为本发明所述的图像追踪分类器的构建方法对第一样本集预处理的流程示意图；

图3为本发明所述的图像追踪分类器的构建方法中卷积神经网络模型的训练流程示意图；

图4为本发明所述的图像追踪分类器的构建方法中卷积神经网络模型的训练工作原理流程示意图；

图5为本发明所述的图像追踪分类器的构建方法另一个实施例的流程示意图；

图6为本发明所述的图像追踪分类器的构建方法另一个实施例中卷积神经网络模型的训练流程框图示意图；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京飞搜科技有限公司，未经北京飞搜科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710503156.5/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种图像追踪分类器的构建方法及应用其的人脸追踪方法在审

专利文献下载