[发明专利]一种基于视频监控图像的内河船舶目标检测方法和装置在审
申请号: | 202110942756.8 | 申请日: | 2021-08-17 |
公开(公告)号: | CN113610178A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 任永梅;贾雅琼;俞斌;李欣;杜鸣笛;吴乐;盛昌飞 | 申请(专利权)人: | 湖南工学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 衡阳雁城专利代理事务所(普通合伙) 43231 | 代理人: | 龙腾 |
地址: | 421002 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视频 监控 图像 内河 船舶 目标 检测 方法 装置 | ||
1.一种基于视频监控图像的内河船舶目标检测方法,其特征在于,包括以下步骤:
S1、从现有的视频监控图像数据集中获取船舶图像及相应的xml标注文件作为训练集,从待检测视频监控图像数据集中获取船舶图像及相应的xml标注文件作为测试集;
S2、使用K-means聚类方法对训练集的真实标注边框进行聚类计算得到最优的初始锚框的宽高和数量;
S3、将训练集的视频监控图像进行预处理和数据增强后输入到Darknet-19网络中进行特征提取,采用语义聚合模块将包含语义信息的深层特征与包含位置信息的浅层特征进行融合,同时使用特征融合模块将浅层特征经过直通层融合到深层特征,并增加一个多尺度目标检测层;
S4、使用DIoU设计损失函数,采用多尺度输入训练策略训练网络模型,通过不断的迭代训练更新权重参数,直到损失函数收敛,保存最优训练模型;
S5、将预处理后的测试集船舶图像输入到Darknet-19网络中进行特征提取,利用所述最优训练模型对待检测船舶图像进行检测,得到船舶目标的预测边框,滤除掉低于阈值的预测边框,使用非极大值抑制算法对预测结果进行后处理,得到目标的类别和边框位置参数。
2.根据权利要求1所述的内河船舶目标检测方法,其特征在于:步骤S1中所获取的船舶图像大小为1920×1080像素,每张船舶图像的xml标注文件中包含对应图片的名称、路径、原始图像的分辨率、类别信息和所有边框的坐标信息。
3.根据权利要求1所述的内河船舶目标检测方法,其特征在于,步骤S2中,利用距离度量指标公式:
d(box,centroid)=1-IoU(box,centroid);
其中,box为船舶目标的真实边框,centroid为聚类的中心锚框,IoU(box,centroid)为船舶目标的真实边框与聚类的中心锚框的交并比,d为船舶目标边框与聚类的中心锚框的距离;
并结合下式计算所有的船舶目标的真实边框与聚类的中心锚框的IoU值的最大平均值,得到平均IoU:
其中,q表示船舶目标的总数,k表示聚类的个数,qk表示第k个聚类中心中的船舶目标的个数;
通过多次聚类试验及综合考虑检测模型的召回率和复杂度来确定k值,进而得到最优的初始锚框的宽高和数量。
4.根据权利要求2所述的内河船舶目标检测方法,其特征在于:步骤S3和步骤S5中还包括对视频监控图像进行预处理的步骤,对视频监控图像进行预处理时,将训练集图像每隔10个epoch缩放到固定尺寸N×N像素,N∈[320,608],步长为32,测试集图像下采样为480×480像素。
5.根据权利要求1所述的内河船舶目标检测方法,其特征在于:步骤S3中还包括将预处理后的视频监控图像进行数据增强的步骤,训练集的视频监控图像经预处理后再进行随机翻转、色调变化、饱和度和曝光变化处理,以实现数据增强。
6.根据权利要求4所述的内河船舶目标检测方法,其特征在于:所述Darknet-19网络由19个卷积层和5个最大池化层组成,卷积核大小为3×3和1×1两种,在3×3大小的卷积核之间使用1×1大小的卷积核来压缩特征并加深网络深度,在批量归一化之后使用leaky ReLU激活函数以避免深层网络出现梯度消失的现象。
7.根据权利要求1中所述的内河船舶目标检测方法,其特征在于:在步骤S3中,语义聚合模块是先对深层特征进行1×1卷积和2倍上采样后再与浅层特征进行聚合;特征融合模块是将浅层特征先经过1×1卷积进行降维,并使用reorg层进行变形,再将其和深层特征进行融合;多尺度目标检测层是在13×13大小的目标检测层的基础上增加了由语义聚合模块和特征融合模块组成的26×26大小的目标检测层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南工学院,未经湖南工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110942756.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序