[发明专利]基于孪生网络和YOLO目标检测模型的目标跟踪方法及系统在审
申请号: | 202111462296.5 | 申请日: | 2021-12-02 |
公开(公告)号: | CN115131694A | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 王瑜;石健彤;段逸凡 | 申请(专利权)人: | 北京工商大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06T7/269;G06N3/04;G06V10/82;G06V10/774;G06V10/74;G06T7/246;G06V10/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100048 北京市海淀区甘家*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 孪生 网络 yolo 目标 检测 模型 跟踪 方法 系统 | ||
1.一种基于孪生网络和YOLO目标检测模型的目标跟踪方法,其特征在于,包括:
输入待测视频文件;
在第一帧中框定待跟踪目标,将目标框调整到固定大小,输入孪生特征提取网络获取目标深度特征;
在后续帧中利用YOLO目标检测模型提取候选框,并将全部候选框调整到固定大小,输入孪生特征提取网络获取深度特征;
将后续帧分别与第一帧、前一帧的特征进行相似性度量,加权求和得到总相关分数;
将得分最高的候选框串联成目标轨迹进行记录,得分低于阈值判断为目标丢失,跳过当前帧继续后续帧目标搜索,形成完整的轨迹链实现目标跟踪。
2.根据权利要求1所述的基于孪生网络和YOLO目标检测模型的目标跟踪方法,其特征在于,所述待测视频文件,即将AVI格式的视频先按帧率截取JPG格式的视频帧数据进行存储。
3.根据权利要求1所述的基于孪生网络和YOLO目标检测模型的目标跟踪方法,其特征在于,所述孪生特征提取网络包括两个部分,第一部分将输入的图像调整到固定大小;第二部分将调整后的第一帧、后续帧目标框图像输入权值共享的卷积神经网络(ConvolutionalNeural Networks,CNN)进行特征提取,分别得到各自的特征向量。
4.根据权利要求1所述的基于孪生网络和YOLO目标检测模型的目标跟踪方法,其特征在于,所述YOLO目标检测模型将输入视频帧图像分成7*7个网格(Grid Cell),每个GridCell负责检测落入该格子的物体,若某个物体的中心位置的坐标落入到该Grid Cell中,那么这个Grid Cell就负责检测出这个物体,输出2个包含物体的矩形区域(Bounding Box)。每个Bounding Box包含5个数据信息,分别是x,y,w,h和confidence。其中,x,y是指当前Grid Cell预测得到的物体的Bounding Box的中心位置的坐标;w,h是Bounding Box的宽度和高度;confidence是反映当前Bounding Box是否包含物体的置信度,计算方式如下:
confidence=P(object)*IOU
其中,若Bounding Box包含物体,则P(object)=1,否则P(object)=0,IOU(Intersection Over Union)为预测Bounding Box与物体真实区域的交集面积,以像素为单位,用真实区域的像素面积归一化到[0,1]区间。
5.根据权利要求1所述的基于孪生网络和YOLO目标检测模型的目标跟踪方法,其特征在于,所述相似性度量使用欧式距离进行计算,公式如下:
DistanceX1,Xi,j=||G(X1)-G(Xi,j)||
DistanceXi,j,Xi+1,k=||G(Xi,j)-G(Xi+1,k)||
其中,Distance,表示欧氏距离,|| ||表示L2范数计算,G(X1)表示第1帧中待跟踪目标的特征向量,G(Xi,j)表示第i帧中第j个候选框的特征向量,G(Xi+1,k)表示第i+1帧中第k个候选框的特征向量。
6.根据权利要求5所述的基于孪生网络和YOLO目标检测模型的目标跟踪方法,其特征在于,所述加权求和得到的总相关分数R计算公式如下:
R=0.5*DistanceX1,Xi,j+0.5*DistanceXi,j,Xi+1,k
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学,未经北京工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111462296.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:阵列开关电路系统及开关电路
- 下一篇:一种特种服及其应用于特种服的检测系统