[发明专利]基于边界紧约束网络的车辆目标位姿检测方法、装置及存储介质有效
申请号: | 202111141461.7 | 申请日: | 2021-09-28 |
公开(公告)号: | CN113591810B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 李庆鹏;王子安;李智勇;方乐缘;李亚萍 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市兴科达知识产权代理有限公司 44260 | 代理人: | 徐民奎 |
地址: | 410082 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 边界 约束 网络 车辆 目标 检测 方法 装置 存储 介质 | ||
1.一种基于边界紧约束网络的车辆目标位姿检测方法,其特征在于,该方法包括如下步骤:
步骤一、数据预处理:对交通场景遥感图像中的车辆目标进行数据标注,得到图像数据,利用图像数据构建YOLO类型数据集,该数据集包括训练集、测试集和验证集;
步骤二、特征提取与融合:利用YOLOv5骨干网络对该图像数据进行多尺度特征提取,得到多尺度特征图,再通过由FPN和PAN结构的颈对图像对多尺度特征图进行多尺度特征融合,实现包含浅层、中层、高层信息的全面特征融合;
步骤三、构建改进的YOLOv5骨干网络模型:在原有的YOLOv5骨干网络的基础上,增加旋转分支,将YOLOv5骨干网络的输出和多尺度特征图作为旋转分支的输入,在旋转分支中,根据具有方向角度目标所带有的方向敏感的旋转不变性特征,将原有的垂直框转化为初具旋转框形式的紧约束凸四边形,再将紧约束凸四边形进一步转化为矩形,即目标旋转框,将目标旋转框结合YOLOv5骨干网络输出的类别和置信度信息,形成最终的旋转框输出信息,完成车辆检测过程;构建YOLOv5模型具体包括如下步骤:
步骤3.1、在原有的YOLOv5骨干网络的基础上,增加旋转分支,并将原有的YOLOv5骨干网络的输出和多尺度特征图作为旋转分支的输入,其中,原有的YOLOv5骨干网络的输出的目标坐标为,其中、、、分别表示原目标预测垂直框的中心横坐标、纵坐标以及目标预测垂直框的宽度和高度;
步骤3.2、旋转分支的ROIAlign层对输入的不同大小的多尺度特征图进行特征大小统一,得到大小一样的尺度的特征图,将统一大小后的特征图经过两个全连接层的计算,根据目标的方向敏感的旋转不变特征,计算得出预测结果,该预测结果为确定中心点和四个顶点坐标的凸四边形,加上原有网络的部分输出,最终输出为,其中为维向量,代表目标属于个类别的概率,、表示目标预测凸四边形的中心横坐标、纵坐标,、、、、、、、分别为四个顶点到以目标预测凸四边形中心为原点所构成坐标轴的横坐标和纵坐标,表示检测结果的置信度,各尺度特征图预测的输出维度增加为,其中为对应尺度特征图的输出分辨率,为每个尺度特征图使用的锚框的个数;
步骤3.3、对步骤3.2得到的凸四边形使用Shamos算法,可得到面积最小的外接矩形,重复旋转并计算更新最小面积直到线旋转过的角度大于90度,此时保存的最小面积的外接矩形,即为所要的目标旋转框;
步骤3.4、将目标旋转框结合YOLOv5骨干网络输出的类别和置信度信息,形成最终的旋转框输出信息,完成车辆检测过程;
步骤四、修改YOLOv5骨干网络损失:在原有的YOLOv5骨干网络损失的基础上,加上旋转分支损失,联合训练构成检测网络。
2.根据权利要求1所述的基于边界紧约束网络的车辆目标位姿检测方法,其特征在于,在步骤一中,数据标注的内容包括车辆类别以及车辆坐标位置。
3.根据权利要求1或2所述的基于边界紧约束网络的车辆目标位姿检测方法,其特征在于,在步骤一中,在YOLO类型数据集中,车辆目标的目标框位置使用如下十一个参数形式进行标注:,其中为目标类别,、表示目标旋转框中心的横坐标、纵坐标,、、、、、、、为四个点相对于中心点的相对坐标。
4.根据权利要求3所述的一种基于边界紧约束网络的车辆目标位姿检测方法,其特征在于,在步骤一中,训练集、测试集和验证集按照6:2:2的比例划分。
5.根据权利要求1所述的基于边界紧约束网络的车辆目标位姿检测方法,其特征在于,在步骤二中,图像数据在进行多尺度特征提取之前需要进行Mosaic数据增强处理,所述YOLOv5骨干网络由Focus、CBL、CSP、SPP模块构成,多尺度特征包括浅层尺度特征、中层尺度特征以及高层尺度特征。
6.根据权利要求1所述的基于边界紧约束网络的车辆目标位姿检测方法,其特征在于,在步骤四中,原有的YOLOv5骨干网络损失包括置信度损失,分类损失以及垂直框边界损失,其中,置信度损失和分类损失使用的都是BCEWithLogitsLoss,垂直框边界损失使用的是GIOU Loss;旋转分支损失通过表示网络预测结果四边形的十维坐标向量和真实值的十维坐标向量进行高维特征尺度上的距离计算得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111141461.7/1.html,转载请声明来源钻瓜专利网。