[发明专利]目标跟踪方法、装置、计算机设备和存储介质在审
申请号: | 202010194270.6 | 申请日: | 2020-03-19 |
公开(公告)号: | CN111429482A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 周康明;朱月萍 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06K9/32 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 曹瀚青 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 跟踪 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种目标跟踪方法、装置、计算机设备和存储介质,通过获取目标对象的模板图像帧和目标对象的检测图像帧后,将模板图像帧和检测图像帧输入预设的目标跟踪网络模型中,得到检测图像帧上目标对象的跟踪框,该方法避免anchor的超参数设计及计算IOU导致的训练复杂性,去除了不确定性,从而提高了目标跟踪网络跟踪目标的精度和鲁棒性。
技术领域
本申请涉及目标检测技术领域,特别是涉及一种目标跟踪方法、装置、计算机设备和存储介质。
背景技术
目标跟踪是指在给定某视频序列初始帧中目标物的大小及位置的情况下,预测后续帧中对应目标物的大小与位置。近年来,随着深度学习的快速发展,CNN被应用到目标跟踪,由于其具有极高的目标特征提取与表达能力,因而对提高目标跟踪的精度和鲁棒性具有重要意义。
SiamRPN++是基于CNN的目标跟踪方法之一,其结合了孪生网络和区域推荐网络,其中,SiamRPN++使用RPN来回归目标位置,需要依赖于预先定义的锚框(anchor boxes),锚框涉及许多超参数的设计,如锚框的尺寸、长宽比、数目等,这些参数通常对最终的检测性能非常敏感,且在模型训练期间,与锚框相关的复杂计算如重叠度(IOU)会明显增加训练内存。
因此,现有的目标跟踪模型训练过程比较复杂,存在较多不确定性,导致目标跟踪的精度和鲁棒性较低。
发明内容
基于此,有必要针对上述技术问题,提供一种目标跟踪的精度和鲁棒性更高的目标跟踪方法、装置、计算机设备和存储介质。
第一方面,本申请提供一种目标跟踪方法,该方法包括:
获取目标对象的模板图像帧和目标对象的检测图像帧;
将模板图像帧和检测图像帧输入预设的目标跟踪网络模型中,得到检测图像帧上目标对象的跟踪框;跟踪框用于标定目标对象;
其中,目标跟踪网络模型包括孪生网络与全卷积一阶段目标检测网络;孪生网络用于提取模板图像帧的特征和检测图像帧的特征;全卷积一阶段目标检测网络用于对目标对象的跟踪框进行分类与回归。
在其中一个实施例中,上述将模板图像帧和检测图像帧输入预设的目标跟踪网络模型中,得到检测图像帧上目标对象的跟踪框,包括:
将模板图像帧和检测图像帧输入至孪生网络进行特征提取,得到模板图像帧和检测图像帧的综合特征图;
将综合特征图输入全卷积一阶段目标检测网络中,对综合特征图中的每一特征点进行回归和分类操作,得到检测图像帧上目标对象的跟踪框。
在其中一个实施例中,上述目标跟踪网络模型的训练过程,包括:
获取多个对象的样本模板图像帧和样本检测图像帧;
将多个对象的样本模板图像帧和样本检测图像帧输入至初始目标跟踪网络模型中的初始孪生网络中,得到多个对象的样本模板图像帧和样本检测图像帧的样本综合特征图;
将样本综合特征图输入至初始目标跟踪网络模型中的初始全卷积一阶段目标检测网络中,对样本综合特征图中的每一点进行回归操作,以训练初始目标跟踪网络模型,直到初始目标跟踪网络模型的损失函数的值的变化幅度处于预设范围内,得到目标跟踪网络模型。
在其中一个实施例中,上述初始孪生网络的基网络包括第一残差网络和与第一残差网络完全相同的第二残差网络;
将多个对象的样本模板图像帧和样本检测图像帧输入至初始目标跟踪网络模型中的初始孪生网络中,得到多个对象的样本模板图像帧和样本检测图像帧的样本综合特征图,包括:
将样本模板图像帧输入第一残差网络中,以及将样本检测图像帧输入第二残差网络中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010194270.6/2.html,转载请声明来源钻瓜专利网。