[发明专利]一种水面光学小目标快速检测与跟踪方法有效
申请号: | 201811017357.5 | 申请日: | 2018-09-01 |
公开(公告)号: | CN109242019B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 盛明伟;金巧园;万磊;王卓;秦洪德;唐松奇;佟鑫 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06V20/40;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 水面 光学 目标 快速 检测 跟踪 方法 | ||
1.一种水面光学小目标快速检测与跟踪方法,其特征在于:包含如下步骤:
步骤(1):水面小目标快速检测;
步骤(1.1):根据水面目标检测任务制作水面目标数据集,并添加标签,然后用水面目标数据集训练神经网络;
步骤(1.2):设计包含自底向上路径、自顶向下路径和横向连接、独立预测三个过程的特征金字塔网络,再设计基于特征金字塔网络的水面目标检测系统,用梯度下降法训练特征金字塔网络参数,直到损失函数达到收敛;
步骤(1.2.1):设计特征金字塔网络的自底向上路径:
将去掉最后一个卷积层的Darknet19作为自底向上的基础网络,将自底向上的基础网络中产生的网络输出尺度相同的许多层视为同一个网络阶段,共有{C'1,C'2,C'3,C'4,C'5}五个网络阶段;用每个网络阶段的最后一层的输出创建特征金字塔层,且在特征金字塔层中剔除C'1网络阶段的输出,即i=2,3,4,5;
步骤(1.2.2):设计特征金字塔网络的自顶向下路径和横向连接:
所述的自顶向下路径包括自顶向下模块T5,4、T4,3、T3,2;C'i网络阶段最后一层的输出输入自顶向下模块Ti,(i-1)中,自顶向下模块Ti,(i-1)用放大倍数为2的最近邻插值法采样,生成在空间上更粗糙、语义上更强的高金字塔层
横向连接模块Li是一个1×1的卷积层,将输入横向连接模块Li处理后得到然后将对应的与融合得到在后加入3×3的卷积层;加入1×1×256的卷积层将特征金字塔层的深度固定为256;生成最终的特征映射层{P2,P3,P4};
步骤(1.2.3):设计特征金字塔网络的独立预测:
在P2、P3、P4三种尺度不同的特征映射层后分别添加卷积层,并共享添加的卷积层的参数;每个特征映射层定义三种尺度的锚点,并在大尺度特征映射层使用小尺度特征映射层的锚点;每个锚点在原图上的宽高固定,并按比例缩小到特征映射层;
步骤(1.2.4):对于每个金字塔层,根据训练中得到的目标信息与真实目标信息计算损失函数:
上式中,当标注目标的中心点落在金字塔层的第i个格子上,且格子i上的第j个锚点与目标IOU最大,则该锚点负责预测目标,此时取1,否则取0;l代表金字塔层的序列号;l.w,l.h代表金字塔层的宽度和高度,l.n代表每个格子的锚点个数;(x,y)是目标实际中心点坐标,w是目标实际宽,h是目标实际高;Ci是置信度;pi(c)是类条件概率;
然后用梯度下降法调整神经网络中参数的取值,直至损失函数达到收敛;
步骤(1.3):进行水面小目标快速检测,每隔n帧,将视频中的关键帧输入基于特征金字塔网络的水面目标检测系统中检测水面目标,保留结果中置信度大于阈值的目标,并用非极大抑制剔除重叠目标,得到关键帧目标,并记录关键帧目标的位置和类别信息;
步骤(2):关键帧目标模型生成;
步骤(3):关键帧间各向异性带宽自适应目标快速跟踪。
2.根据权利要求1所述的一种水面光学小目标快速检测与跟踪方法,其特征在于:所述的步骤(2)具体为:
步骤(2.1):设矩形框的宽度为2a、高度为2b;设核函数作用区域为椭圆形,且是与矩形框内切的最大椭圆;将核函数作用区域的颜色空间从RGB转换到Luv,转换公式为:
上式中,cons=X+15×Y+3×Z;
步骤(2.2):将Luv量化为m个等级,计算水面目标区域中每个等级对应的特征子模型概率密度:
上式中,u是量化等级,取值范围为1至m之间的整数包括1和m;k()是核剖面函数;b()是计算位置x对应的颜色等级的函数;δ[·]是Kroneckerdelta函数;
C是归一化常数,
3.根据权利要求1所述的一种水面光学小目标快速检测与跟踪方法,其特征在于:所述的步骤(3)具体为:
步骤(3.1):设n1为目标区域的像素数,nh是目标候选区域的像素数,且每一帧图像的初始尺度参数都为1,1)T,然后用前一次迭代的尺度参数和归一化常数当前迭代的尺度参数(h1,h2)T表示当前迭代的归一化常数,则nh=πabn1,用黎曼积分可得出:
则当前迭代的归一化常数Ch:
步骤(3.2):将当前迭代的归一化常数代入目标模型和目标候选模型之间的相似度函数,并泰勒展开后得:
其中,δ[·]是Kroneckerdelta函数;
引入梯度上升法使相似度函数值达到最大,泰勒展开后的第二项是用核剖面函数k(x)估计当前帧y处的核密度;
计算MeanShift向量得到核密度,MeanShift向量表示将窗口中心移动到窗口重心的大小和方向;窗口中心移动后,重心又重新移动,迭代计算新的MeanShift向量;
MeanShift向量的迭代计算式:
上式中,
取学习率为用梯度上升法迭代更新后:
步骤(3.3):引入正则化参数rs和rb修正尺度参数,并更新最终的尺度参数;
惩罚变化过大的尺度参数:
引入正则化参数rb强制核函数作用区域包含背景像素:
上式中,ρ是核函数作用区域中应该包含的背景像素的比例;B(y,h)是目标模型中的像素点在目标候选模型中的和与目标模型中所有像素点的的和之比;
更新最终的尺度参数:
步骤(3.4):利用步骤(3.2)搜索当前帧目标所在的位置:当漂移距离小于阈值或迭代次数超过阈值时,输出该帧目标位置,尺度参数、核函数带宽;
步骤(3.5):当达到迭代次数阈值时,若目标候选模型与目标模型的相似度仍然低于阈值,则判定目标在关键帧间因丢失或消失在视野内,提取结束该目标的跟踪,若所有水面目标均提前结束时返回步骤(1.1)重新检测目标;当迭代次数小于阈值时,视目标跟踪在帧间顺利进行,重复步骤(3.1)至步骤(3.4),未出现所有目标均提前结束时,跟踪在下一个关键帧结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811017357.5/1.html,转载请声明来源钻瓜专利网。