[发明专利]一种海面目标动作跟踪方法、终端设备及存储介质在审
申请号: | 202210437571.6 | 申请日: | 2022-04-25 |
公开(公告)号: | CN114757973A | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 王荣杰;郜怀通;程静;王亦春;林安辉;刘文霞 | 申请(专利权)人: | 集美大学 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06V20/40;G06V40/20;G06N3/04;G06N3/08;G06V10/25;G06V10/82 |
代理公司: | 厦门市精诚新创知识产权代理有限公司 35218 | 代理人: | 赵薇 |
地址: | 361000 福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 海面 目标 动作 跟踪 方法 终端设备 存储 介质 | ||
1.一种海面目标动作跟踪方法,其特征在于,包括以下步骤:
S1:采集海面目标视频,并对其中的视频帧进行锚框标注,将标注后的海面目标视频组成训练集;
S2:构建动作跟踪模型,通过训练集对动作跟踪模型进行训练;
动作跟踪模型的网络结构包括两个分支神经网络和一个全连接网络,将海面目标视频的待跟踪视频帧对应的对照模板和感兴趣区域各输入一个分支神经网络后,得到对照模板的卷积特征和感兴趣区域的卷积特征,将对照模板的卷积特征和感兴趣区域的卷积特征均转换为一维向量后,与初始锚框进行拼接,将拼接结果输入全连接网络后,得到初始锚框应进行的动作;
S3:通过训练后的动作跟踪模型对海面目标视频中的海面目标的动作进行跟踪。
2.根据权利要求1所述的海面目标动作跟踪方法,其特征在于:两个分支神经网络均包括5层卷积层和3层池化层,全连接网络包括3层全连接层。
3.根据权利要求1所述的海面目标动作跟踪方法,其特征在于:步骤S2的模型训练过程中训练数据的获取过程包括:
S211:从训练集中随机读取视频,并随机选择用于训练的视频帧t1;
S212:获取视频帧t1对应的对照模板、感兴趣区域和初始锚框;
S213:对对照模板和感兴趣区域的尺寸进行格式统一;
S214:对输入图像进行归一化和标准化;
S215:根据视频帧t1的标注数据和初始锚框获取初始锚框对应的标注动作。
4.根据权利要求1所述的海面目标动作跟踪方法,其特征在于:对照模板、感兴趣区域和初始锚框的获取方法为:当准备对视频中第t1帧进行跟踪训练时,从视频中选择t0帧和t2帧,且满足t0≠t1≠t2,|t1-t2|≤kd,kd表示选取视频帧时间间隔阈值;根据t0帧的标注锚框在t0帧中截取对照模板,将t2帧的标注锚框作为初始锚框,并根据初始锚框在第t1帧中截取感兴趣区域。
5.根据权利要求1所述的海面目标动作跟踪方法,其特征在于:对照模板、感兴趣区域和初始锚框的获取方法为:当准备对视频中第t1帧进行跟踪训练时,根据t1帧的标注锚框在t1帧中截取对照模板,通过对标注锚框进行随机变换得到噪音锚框,根据t1帧图像按下式对噪音锚框的数据进行调整,将调整后的噪音锚框加入噪音锚框集合中;
其中,wn和hn分别表示调整后的噪音锚框的宽和高,(x1_n,y1_n)表示噪音锚框的左上角坐标;
进行训练时,从噪音锚框集合中随机抽取噪音锚框作为t1帧的初始锚框,并根据初始锚框在t1帧中截取感兴趣区域。
6.根据权利要求4或5所述的海面目标动作跟踪方法,其特征在于:感兴趣区域的截取范围如下式所示:
其中,ws、hs、(x1_s,y1_s)、(x2_s,y2_s)分别表示截取范围的宽度、高度、左上角直角坐标和右下角直角坐标;wbbox和hbbox分别表示初始锚框的宽和高;(x1,y1)表示初始锚框的左上角坐标;a表示用来根据锚框的宽和高初步设定感兴趣区域的宽和高的参数;wimg表示图像的宽度;yimg表示图像的高度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于集美大学,未经集美大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210437571.6/1.html,转载请声明来源钻瓜专利网。