[发明专利]一种基于光视觉的水面目标检测与识别方法有效

申请号：	202110092334.6	申请日：	2021-01-24
公开（公告）号：	CN112949385B	公开（公告）日：	2022-12-23
发明（设计）人：	王银涛;张冰;闫峥;贾晓宝;严卫生;崔荣鑫;张守旭;李宏;王崇武	申请（专利权）人：	西北工业大学
主分类号：	G06V20/13	分类号：	G06V20/13;G06V10/762;G06V10/82;G06N3/04;G06N3/08
代理公司：	西安凯多思知识产权代理事务所(普通合伙) 61290	代理人：	刘新琼
地址：	710072 ***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于视觉水面目标检测识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于光视觉的水面目标检测与识别方法，其特征在于，包括以下步骤：

步骤1：使用ZED双目立体相机采集多幅目标物体图像；将采集到的目标物体图像分成多个集合，对目标物体图像进行预处理，同一个集合内的目标物体图像采用的预处理方法相同；预处理方法包括但不限于剪裁、拼接、高斯噪声和模糊处理；经过预处理的目标物体图像构成目标物体数据集；

步骤2：使用LabelImg工具对目标物体数据集的图像进行标定；

步骤2-1：将目标物体数据集图像导入标定工具LabelImg中；

步骤2-2：通过LabelImg工具对目标物体的位置和种类进行标定，得到与原始图像相同文件名的xml格式文件；将目标最小外接矩形作为边界框，所标定目标物体的位置数据为边界框四角的坐标；

步骤3：使用K-means聚类方法对边界框进行聚类；

步骤3-1：将边界框四角的坐标转换为边界框的长宽信息，具体为：用边界框右下角点横坐标减去左上角横坐标得到边界框的长，右下角纵坐标减去左上角纵坐标得到边界框的宽；

步骤3-2：定义K个锚框，随机选取K个边界框；K个锚框的长宽分别与随机选取的K个边界框的长宽相同；

步骤3-3：计算所有边界框分别与K个锚框的交并比值IOU，再计算误差；

设定d表示误差，公式如下：

d(box,centr)＝1-IOU(box,centr) (1)

式中：box表示边界框，centr表示锚框；

步骤3-4：对于每个边界框，对该边界框与K个锚框的误差进行排序，将该边界框与最小误差对应的锚框分为一类；则将所有边界框分为K类；

步骤3-5：求取每一类中所有边界框的长宽均值作为新的锚框长宽；共生产K个新的锚框；

步骤3-6：重复步骤3-3到步骤3-5，直至边界框的分类不再发生变化，完成边界框的聚类；

步骤4：训练YOLOv4深度学习模型；

以目标物体数据集作为YOLOv4深度学习模型的训练样本，步骤2标定的目标物体的种类和步骤3聚类的目标边界框作为标签，对YOLOv4深度学习模型进行训练，设定学习率和损失函数，当损失函数值最小时的权重作为最终的YOLOv4深度学习模型权重；

步骤5：对YOLOv4深度学习模型进行稀疏训练和剪枝处理；

步骤5-1：设定稀疏率s值，对YOLOv4深度学习模型稀疏训练；

步骤5-2：对YOLOv4深度学习模型进行剪枝处理：在层剪枝时，设定剪掉12个shortcut，相当于剪掉36层；在通道剪枝时，选择剪枝率最高的策略，剪枝力度设定为0.8；

步骤5-3：再以目标物体数据集作为训练样本，步骤2标定的目标种类和步骤3聚类的目标边界框作为标签，对经过稀疏训练和剪枝处理的YOLOv4深度学习模型进行训练，得到最终的YOLOv4深度学习模型；

步骤6：将待检测图像输入最终的YOLOv4深度学习模型，进行目标检测与识别。

2.根据权利要求1所述的一种基于光视觉的水面目标检测与识别方法，其特征在于，所述稀疏率s＝0.001。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西北工业大学，未经西北工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110092334.6/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载