[发明专利]视觉跟踪方法、装置、介质及设备有效
申请号: | 201810885811.2 | 申请日: | 2018-08-06 |
公开(公告)号: | CN109242882B | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 钟钊;杨子琛;胡扬阳;武伟 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06N3/04 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视觉 跟踪 方法 装置 介质 设备 | ||
1.一种视觉跟踪方法,其特征在于,包括:
针对图像序列中的当前图像,获取目标对象的图像块;
将所述图像块输入至跟踪控制网络,获取所述目标对象的跟踪策略信息;
根据所述跟踪策略信息对所述目标对象进行跟踪处理;其中,所述跟踪控制网络是利用设置有目标对象位置标注信息的样本图像序列,采用强化学习方式训练获得的;
其中,针对多目标跟踪应用场景,所述跟踪策略信息包括:预先设置的至少两种不同的跟踪策略分别对应的概率;针对单目标跟踪应用场景,所述跟踪策略信息包括:跟踪器采用的跟踪策略的置信度;针对多目标跟踪应用场景和单目标跟踪应用场景,根据所述跟踪策略信息对所述目标对象进行跟踪处理的方式不同。
2.根据权利要求1所述的方法,其特征在于,所述将所述图像块输入至跟踪控制网络包括:
获取所述图像块的特征图或者热力图,并将所述特征图或者热力图输入至跟踪控制网络。
3.根据权利要求1所述的方法,其特征在于,针对多目标跟踪应用场景,所述根据所述跟踪策略信息对所述目标对象进行跟踪处理包括:
根据所述概率从预先设置的至少两种不同的跟踪策略中选择对应的跟踪策略;
其中,所述至少两种不同的跟踪策略包括:由跟踪器对目标对象继续跟踪,和/或,针对当前图像全局检测所述目标对象。
4.根据权利要求3所述的方法,其特征在于,所述根据所述跟踪策略信息对所述目标对象进行跟踪处理还包括:
在所述选择的跟踪策略为由跟踪器对目标对象继续跟踪的情况下,将所述当前图像的下一个图像作为当前图像并提供给所述跟踪器,由所述跟踪器对所述目标对象继续跟踪。
5.根据权利要求3所述的方法,其特征在于,所述根据所述跟踪策略信息对所述目标对象进行跟踪处理还包括:
在所述选择的跟踪策略为针对当前图像全局检测所述目标对象的情况下,将所述当前图像提供给全局检测器,由所述全局检测器对所述当前图像进行目标对象检测。
6.根据权利要求5所述的方法,其特征在于,所述根据所述跟踪策略信息对所述目标对象进行跟踪处理还包括:
根据全局检测器输出的目标对象位置信息,对跟踪器进行初始化设置;
将所述当前图像的下一个图像作为当前图像,提供给跟踪器,以由跟踪器对所述目标对象继续跟踪。
7.根据权利要求1所述的方法,其特征在于,针对单目标跟踪应用场景,所述根据所述跟踪策略信息对所述目标对象进行跟踪处理包括:
根据不同跟踪器各自对应的置信度以及不同跟踪器采用不同跟踪策略所形成的目标对象的位置信息,进行目标对象位置融合处理;
其中,所述融合处理后的目标对象的位置被作为跟踪处理最终获得的目标对象的位置。
8.根据权利要求1至6中任一项所述的方法,其特征在于,针对多目标跟踪应用场景,训练所述跟踪控制网络的过程包括:
针对样本图像序列中的当前图像样本,获取目标对象的图像块;
将所述图像块提供给待训练的跟踪控制网络,获取所述待训练的跟踪控制网络输出的目标对象的跟踪策略信息;
根据所述待训练的跟踪控制网络输出的跟踪策略信息,基于随机分布方式,确定最终跟踪策略信息;
根据所述最终跟踪策略信息对所述目标对象进行跟踪处理;
根据跟踪处理获得的多个图像样本的目标对象的位置信息与相应的图像样本的目标对象位置标注信息所对应的位置之间的面积重叠情况,确定所述样本图像序列的决策评价值,根据所述样本图像序列的决策评价值,采用强化学习方式,调整所述待训练的跟踪控制网络的网络参数。
9.根据权利要求8所述的方法,其特征在于,在所述面积重叠情况符合预定要求的情况下,所述待训练的跟踪控制网络训练成功。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810885811.2/1.html,转载请声明来源钻瓜专利网。