[发明专利]一种单目标跟踪方法有效
申请号: | 201910707376.9 | 申请日: | 2019-08-01 |
公开(公告)号: | CN110634151B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 宋建锋;苗启广;王伟伟;王崇晓;刘向增;权义宁;盛立杰;刘如意;戚玉涛 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06K9/62;G06V10/774;G06N3/04;G06N3/08 |
代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 史玫 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 跟踪 方法 | ||
1.一种单目标跟踪方法,其特征在于,对待跟踪视频中的各帧图像按照时间顺序依次进行跟踪,所述各帧图像处于同一坐标系,方法包括:
步骤一,对第一帧图像中的目标坐标进行标注,并在目标周围区域进行随机裁剪得到若干图像单元;以第一帧图像的所有图像单元为样本对神经网络进行训练,得到初始单目标跟踪模型;
步骤二,采用Step2.1至Ste2.3依次对第二帧至第N帧图像中的目标进行跟踪,N为大于3小于等于6的自然数;
Step2.1,以上一帧图像中的目标坐标作为当前帧图像中的目标,并在当前帧目标周围区域进行随机裁剪得到当前帧图像的若干图像单元;
Step2.2,将当前帧图像的所有图像单元输入初始单目标跟踪模型,采用初始单目标跟踪模型对当前帧图像中的目标进行跟踪,输出各图像单元的置信度和图像特征,将各图像单元的图像特征放入当前样本库中,样本库的初始为空;
Step2.3,采用RPN网络对置信度可靠的图像单元进行目标尺度估计,得到当前帧图像的目标坐标;
步骤三,采用Step3.1至Step3.4依次对第N+1帧至N+n帧图像中的目标进行跟踪,n为大于2小于等于6的自然数;
Step3.1,以上一帧图像中的目标坐标作为当前帧图像中的目标,并在目标周围区域进行随机裁剪得到当前帧图像的若干图像单元;
Step3.2,将当前帧图像的所有图像单元输入当前单目标跟踪模型,采用当前单目标跟踪模型对当前帧图像中的目标进行跟踪,输出各图像单元的置信度和图像特征,将各图像单元的图像特征放入当前样本库,
Step3.3,以当前帧以前的图像的所有置信度作为参照,采用LOF算法对Step3.2得到的图像单元置信度的均值进行检测,得到异常样本的概率值,概率值大于等于第一阈值时Step3.2得到的置信度可靠的图像单元为正常样本,小于第一阈值时Step3.2得到的置信度可靠的图像单元为异常样本;第一阈值取值范围为大于0小于1;
Step3.4,采用RPN网络对Step3.2得到的置信度可靠的图像单元进行目标的尺度估计,得到当前帧图像的目标坐标,Step3.2得到的置信度可靠的图像单元为异常样本时所采用的RPN网络候选框个数大于Step3.2得到的置信度可靠的图像单元为正常样本时所采用的RPN网络候选框个数;
步骤四,采用K-Means++聚类方法对当前样本库的样本进行更新,然后利用更新后的样本库对当前单目标跟踪模型进行训练更新;
步骤五,循环执行步骤三和步骤四对第N+n+1帧及其以后的视频帧中的目标进行跟踪直至完成对待跟踪视频的跟踪,每次循环所用单目标跟踪模型为上一次更新所得到的新的单目标跟踪模型。
2.如权利要求1所述的单目标跟踪方法,其特征在于,在对目标视频进行跟踪前对待跟踪视频中的各帧图像进行强化目标信息的预处理。
3.如权利要求1所述的单目标跟踪方法,其特征在于,步骤一包括:
Step1.1,对第一帧图像中的目标坐标进行标注,并在目标周围区域进行随机裁剪得到若干图像单元;
Step1.2,获取第一帧图像的各图像单元与目标重叠面积大小,根据重叠面积占目标区域面积的比值大小将多个图像单元划分为正样本与负样本,比值大于第二阈值的为正样本,比值小于第二阈值的为负样本,第二阈值取值范围为大于0小于1;
Step1.3,采用Step1.2得到的正、负样本对神经网络进行训练,得到初始单目标跟踪模型。
4.如权利要求1所述的单目标跟踪方法,其特征在于,所述神经网络由三个卷积层和两个全连接层构成,所述三个卷积层用来提取图像特征,两个全连接层将卷积层提出的特征映射到样本标记空间,对特征进性分类。
5.如权利要求1所述的单目标跟踪方法,其特征在于,Step2.2中所述样本库包括正样本库和负样本库,将置信度可靠的图像单元的图像特征放入正样本库,其余图像特征放入负样本库,正样本库和负样本库的初始均为空。
6.一种单目标跟踪方法,其特征在于,方法包括:
Step1,对目标视频中的各帧图像进行图像对比度增强、图像直方图均衡化及坐标归一化处理,得到用于跟踪的多帧图像;
Step2,对第一帧图像中的目标坐标进行标注,并在目标区域周围进行随机裁剪得到若干图像单元;
Step3,对第一帧图像的图像单元,获取各图像单元与目标重叠面积大小,根据重叠面积占目标区域面积的比值大小将多个图像单元划分为正样本与负样本,比值大于阈值的为正样本,比值小于阈值的为负样本,阈值取值范围为大于0小于1;
Step4,采用步骤三得到的正、负样本对神经网络进行训练,得到初始单目标跟踪模型;
Step5,以第一帧图像中的目标坐标作为第二帧图像中的目标区域的中心,并在该目标区域中心周围进行随机裁剪得到当前帧图像的若干图像单元;
Step6,将第二帧图像的所有图像单元输入初始单目标跟踪模型,采用初始单目标跟踪模型对当前帧图像中的目标进行跟踪,输出各图像单元的置信度和图像特征;将置信度可靠的图像单元的图像特征放入当前正样本库,剩余的图像单元的图像特征放入当前负样本库,正样本库和负样本库的初始均为空;
Step7,采用RPN网络对置信度可靠的图像单元进行目标的尺度估计,得到第二帧图像的目标坐标;
Step8,循环执行Step5至Step7依次对第三至第N帧图像中的目标进行跟踪:N为大于3小于等于6的自然数;
Step9,以第N帧图像中的目标坐标作为第N+1帧图像中的目标区域中心,并在该目标区域中心周围进行随机裁剪得到当前帧图像的若干图像单元;
Step10,将第N+1帧图像的所有图像单元输入初始单目标跟踪模型,采用初始单目标跟踪模型对当前帧图像中的目标进行跟踪,输出各图像单元的置信度和图像特征;将置信度可靠的图像单元的图像特征放入当前正样本库,剩余的图像单元的图像特征放入当前负样本库;
Step11,以前N帧图像的多个置信度为参照,采用LOF算法对Step10得到的可靠的置信度的均值进行检测,得到异常样本的概率值,概率值大于等于阈值时Step10得到的排序靠前的置信度的图像单元的图像特征为正常样本,小于阈值时Step10得到的排序靠前的置信度的图像单元的图像特征是异常样本;
Step12,采用RPN网络对Step11得到的置信度可靠的图像单元进行目标的尺度估计,得到第N+1帧视频帧目标坐标,Step11得到的置信度可靠的图像单元为异常样本时所采用的RPN网络候选框个数大于正常样本时所采用的RPN网络候选框个数;
Step13,循环执行Step9至Step12对第N+2至第N+n帧进行处理,n为大于2小于等于6的自然数;
Step14,采用K-Means++算法对当前样本库的样本进行更新,然后利用更新后的样本库对当前单目标跟踪模型进行训练更新,得到新的单目标跟踪模型;
Step15,循环执行Step13至Step14对第N+n+1帧及其以后的视频帧中的目标进行跟踪直至完成对待跟踪视频的跟踪,每次循环所用单目标跟踪模型为上一次循环更新后的单目标跟踪模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910707376.9/1.html,转载请声明来源钻瓜专利网。