[发明专利]一种基于光视觉的水面目标检测与识别方法有效
申请号: | 202110092334.6 | 申请日: | 2021-01-24 |
公开(公告)号: | CN112949385B | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 王银涛;张冰;闫峥;贾晓宝;严卫生;崔荣鑫;张守旭;李宏;王崇武 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06V20/13 | 分类号: | G06V20/13;G06V10/762;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 刘新琼 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视觉 水面 目标 检测 识别 方法 | ||
1.一种基于光视觉的水面目标检测与识别方法,其特征在于,包括以下步骤:
步骤1:使用ZED双目立体相机采集多幅目标物体图像;将采集到的目标物体图像分成多个集合,对目标物体图像进行预处理,同一个集合内的目标物体图像采用的预处理方法相同;预处理方法包括但不限于剪裁、拼接、高斯噪声和模糊处理;经过预处理的目标物体图像构成目标物体数据集;
步骤2:使用LabelImg工具对目标物体数据集的图像进行标定;
步骤2-1:将目标物体数据集图像导入标定工具LabelImg中;
步骤2-2:通过LabelImg工具对目标物体的位置和种类进行标定,得到与原始图像相同文件名的xml格式文件;将目标最小外接矩形作为边界框,所标定目标物体的位置数据为边界框四角的坐标;
步骤3:使用K-means聚类方法对边界框进行聚类;
步骤3-1:将边界框四角的坐标转换为边界框的长宽信息,具体为:用边界框右下角点横坐标减去左上角横坐标得到边界框的长,右下角纵坐标减去左上角纵坐标得到边界框的宽;
步骤3-2:定义K个锚框,随机选取K个边界框;K个锚框的长宽分别与随机选取的K个边界框的长宽相同;
步骤3-3:计算所有边界框分别与K个锚框的交并比值IOU,再计算误差;
设定d表示误差,公式如下:
d(box,centr)=1-IOU(box,centr) (1)
式中:box表示边界框,centr表示锚框;
步骤3-4:对于每个边界框,对该边界框与K个锚框的误差进行排序,将该边界框与最小误差对应的锚框分为一类;则将所有边界框分为K类;
步骤3-5:求取每一类中所有边界框的长宽均值作为新的锚框长宽;共生产K个新的锚框;
步骤3-6:重复步骤3-3到步骤3-5,直至边界框的分类不再发生变化,完成边界框的聚类;
步骤4:训练YOLOv4深度学习模型;
以目标物体数据集作为YOLOv4深度学习模型的训练样本,步骤2标定的目标物体的种类和步骤3聚类的目标边界框作为标签,对YOLOv4深度学习模型进行训练,设定学习率和损失函数,当损失函数值最小时的权重作为最终的YOLOv4深度学习模型权重;
步骤5:对YOLOv4深度学习模型进行稀疏训练和剪枝处理;
步骤5-1:设定稀疏率s值,对YOLOv4深度学习模型稀疏训练;
步骤5-2:对YOLOv4深度学习模型进行剪枝处理:在层剪枝时,设定剪掉12个shortcut,相当于剪掉36层;在通道剪枝时,选择剪枝率最高的策略,剪枝力度设定为0.8;
步骤5-3:再以目标物体数据集作为训练样本,步骤2标定的目标种类和步骤3聚类的目标边界框作为标签,对经过稀疏训练和剪枝处理的YOLOv4深度学习模型进行训练,得到最终的YOLOv4深度学习模型;
步骤6:将待检测图像输入最终的YOLOv4深度学习模型,进行目标检测与识别。
2.根据权利要求1所述的一种基于光视觉的水面目标检测与识别方法,其特征在于,所述稀疏率s=0.001。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110092334.6/1.html,转载请声明来源钻瓜专利网。