[发明专利]一种图像追踪分类器的构建方法及应用其的人脸追踪方法在审
申请号: | 201710503156.5 | 申请日: | 2017-06-27 |
公开(公告)号: | CN107273933A | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 樊应若;董远;白洪亮 | 申请(专利权)人: | 北京飞搜科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06T7/246 |
代理公司: | 北京卓唐知识产权代理有限公司11541 | 代理人: | 唐海力,韩来兵 |
地址: | 100082 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 追踪 分类 构建 方法 应用 | ||
技术领域
本发明涉及人脸追踪技术领域,具体涉及一种图像追踪分类器的构建 方法及应用其的人脸追踪方法。
背景技术
现如今的追踪算法主要有基于传统特征的机器学习、滤波器学习等算 法,但是由于提取的是HOG等传统特征,鲁棒性较差,对于光照模糊、尺 寸变化等复杂场景追踪效果不佳。
现有的人脸追踪方法存在如下技术缺陷:1)目前对于人脸,深度学习 用于追踪时,在线微调,计算量大,难以达到实时性的问题;2)针对光照 变化、快速移动情况,传统算法效果不好的问题。
发明内容
本发明的目的提供一种加强因光照及尺寸变化等复杂场景下导致的人脸 追踪方法的鲁棒性,加快人脸追踪技术的计算速度,并提高人脸追踪模型的效 率。
为了实现上述目的,本发明提供了一种图像追踪分类器的构建方法, 包括如下步骤:
获取用于训练的第一样本集;
构建卷积神经网络模型;
对第一样本集中每张图片进行目标框标记后,进行预处理得到第一目 标区域图像和第二目标区域图像,第一目标区域图像根据目标框进行图像 扩展得到,第二目标区域图像通过由第一目标区域图像和对应目标框标注 图像变换得到;
利用所有的第一图像区域和第二图像区域对卷积神经网络模型进行训 练,得到目标回归模型。
进一步,所述对第一样本集中每张图片进行目标框标记后,进行预处 理得到第一目标区域图像和第二目标区域图像包括
利用样本集中目标框的标注,得到目标区域图像;
获取目标区域图像的中心坐标,根据中心坐标将目标区域对象进行扩 展处理,得到第一目标区域图像;
对第一目标区域图像进行放缩、平移变换,得到第二目标区域图像。
进一步,第一样本集包括图片集和视频集;
其中,所述利用所有的第一图像区域和第二图像区域对卷积神经网络 模型进行训练,得到得到目标回归模型还包括
判断第一样本集是否为视频集;
如果第一样本集为视频集,则获取并利用当前帧图片的第一图像区域 和下一帧图片的第二图像区域对卷积神经网络模型进行训练;
如果第一样本集非视频集,则获取并利用当前图片的第一图像区域及 其第二图像区域对卷积神经网络模型进行训练。
进一步,所述图像分类模型包括依次连接的5个卷积层和2个全连接 层;
还包括
接收第二样本集;
对第二样本集中每张图片进行目标框标记后预处理,得到第三目标区 域图像和第四目标区域图像;
固定图像分类模型中卷积层参数,利用所有的第三目标区域图像和第 四对目标回归模型进行再次训练,重新调节全连接层的参数,得到图像追 踪分类器。
进一步,第三目标区域图像根据第二样本集中每张图片的目标框进行 图像扩展得到,第四目标区域图像通过由第三目标区域图像和对应目标框 标注图像变换得到。
进一步,所述第二样本集为视频集。
本发明还提供了一种应用图像追踪分类器的人脸追踪方法,包括如下 步骤:
接收人脸追踪视频集;
将人脸追踪视频集输入利用所述图像追踪分类器,在人脸追踪视频集 中每张人脸图片上进行追踪预测。
在上述技术方案中,本发明利用基于深度学习的卷积神经网络提取的特 征,有效解决了鲁棒性和精确度平衡的问题,同时基于caffe架构中构建的 CNN网络模型对快速移动、光照模糊变化有更强的鲁棒性,运算量小,提高 了追踪的速度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施 例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是 本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些 附图获得其他的附图。
图1为本发明所述的图像追踪分类器的构建方法一个实施例的流程示意 图;
图2为本发明所述的图像追踪分类器的构建方法对第一样本集预处理的 流程示意图;
图3为本发明所述的图像追踪分类器的构建方法中卷积神经网络模型的 训练流程示意图;
图4为本发明所述的图像追踪分类器的构建方法中卷积神经网络模型的 训练工作原理流程示意图;
图5为本发明所述的图像追踪分类器的构建方法另一个实施例的流程示 意图;
图6为本发明所述的图像追踪分类器的构建方法另一个实施例中卷积神 经网络模型的训练流程框图示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京飞搜科技有限公司,未经北京飞搜科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710503156.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多类别图像识别方法及系统
- 下一篇:一种基于属性融合的图聚类方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序