[发明专利]行人目标跟踪方法、装置及设备有效
申请号: | 201811386432.5 | 申请日: | 2018-11-20 |
公开(公告)号: | CN109598743B | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 车广富;董玉新;安山 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06T7/292 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 罗英;刘芳 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行人 目标 跟踪 方法 装置 设备 | ||
1.一种行人目标跟踪方法,其特征在于,包括:
获取多个摄像头所拍摄的连续视频图像,每路所述摄像头预先设置最佳拍摄视野;
采用目标行人检测的卷积神经网络模型确定每个摄像头所采集的连续视频图像中的行人目标;
对多个摄像头所采集的连续视频图像中的行人目标进行匹配跟踪;
其中,所述采用目标行人检测的卷积神经网络模型确定每个摄像头所采集的连续视频图像中的行人目标,具体包括:
采用所述神经网络模型确定每个所述视频图像中的行人头部的位置;
根据所述行人头部的位置以及所述视频图像对应的最佳拍摄视野确定所述行人目标的位置;
所述神经网络模型包括全局神经网络模型和局部神经网络模型;
所述全局神经网络模型用于在视频图像的全局范围内确定行人头部的位置;
所述局部神经网络模型用于在上一帧所确定的位置的预设范围内确定行人头部的位置;
所述获取多个摄像头所拍摄的连续视频图像之前,还包括:
对所述多个摄像头中视野存在交叠的摄像头进行视野划分来确定每个所述摄像头的最佳拍摄视野,以使得同一行人目标仅位于一个摄像头的最佳拍摄视野中,各路摄像头的最佳拍摄视野之间不存在视野交叠。
2.根据权利要求1所述的方法,其特征在于,所述采用目标行人检测的卷积神经网络模型确定每个摄像头所采集的连续视频图像中的行人目标之前,还包括:
获取数个视频图像样本,所述视频图像样本中包括行人目标在所述视频图像样本中的位置信息;
根据所述数个视频图像样本对行人目标头部检测模型进行训练,得到所述神经网络模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述数个视频图像样本对行人目标头部检测模型进行训练,包括:
利用迁移学习算法对所述行人目标头部检测模型进行训练。
4.根据权利要求1所述的方法,其特征在于,所述采用所述神经网络模型确定每个所述视频图像中的行人头部的位置,包括:
采用所述全局神经网络模型确定每个所述视频图像中的行人头部的第一位置集合;
采用所述局部神经网络模型确定每个所述视频图像中的行人头部的第二位置集合;
所述根据所述行人头部的位置以及所述视频图像对应的最佳拍摄视野确定所述行人目标的位置,包括:
根据每个所述视频图像的第一位置集合以及所述视频图像对应的最佳拍摄视野确定该视频图像的第一目标位置集合;
根据每个所述视频图像的第二位置集合以及所述视频图像对应的最佳拍摄视野确定该视频图像的第二目标位置集合。
5.根据权利要求4所述的方法,其特征在于,所述对多个摄像头所采集的连续视频图像中的行人目标进行匹配跟踪,包括:
利用匈牙利算法对每个摄像头所采集的连续视频图像中的行人目标进行匹配跟踪。
6.根据权利要求5所述的方法,其特征在于,所述利用匈牙利算法对每个摄像头所采集的连续视频图像中的行人目标进行匹配跟踪,具体包括:
利用所述匈牙利算法,根据每个摄像头所采集的视频图像的第一目标位置集合和第二目标位置集合中的位置框的相似度,对行人目标进行匹配跟踪;
其中,所述位置框的相似度根据如下公式确定:
i=1,2,3,…N,j=1,2,3,…M
其中,Oi表示所述第一目标位置集合中第i个位置框,N表示所述第一目标位置集合中位置框的总数,Oj表示所述第二目标位置集合中第j个位置框,M表示所述第二目标位置集合中位置框的总数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811386432.5/1.html,转载请声明来源钻瓜专利网。