[发明专利]基于改进YOLOv3网络的野外山林环境目标检测方法有效
申请号: | 202011639547.8 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112668662B | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 彭志红;蒋卓;陈杰;奚乐乐;王星博 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V20/60;G06V10/82;G06N3/08;G06N3/04 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 田亚琪 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 yolov3 网络 野外 山林 环境 目标 检测 方法 | ||
1.基于改进YOLOv3网络的野外山林环境目标检测方法,其特征在于,包括以下步骤:
步骤一、获取野外山林背景图片以及前景对象,预设检测目标种类为人和车辆;
步骤二、通过图像预处理将背景与前景叠加,生成数据集,并获取前景对象的包围框与类别数据,生成与PASCALVOC2012数据集相同格式的xml文件,即得到训练集、验证集和测试集;
步骤三、基于YOLOv3网络模型,在不同尺度的特征提取层之后添加空间变换层STL,以不同尺度的特征图作为输入,训练得到不同的仿射变换结果,再对STL层的输出特征,进行后续的分类和包围框回归操作;
步骤四、在网络最后添加逆空间变换层de-STL,使得最终计算结果与仿射变换之前的以feature map为坐标系的真值包围框的编码结果相匹配,得到与原图坐标系对应的x和y,再计算location的损失、目标置信度损失和目标类别损失,得到改进后的YOLOv3网络模型;
步骤五、利用步骤二所得的训练集、验证集和测试集对步骤四所得到的改进后的YOLOv3网络进行训练,得到性能最优模型,利用该最优模型进行目标检测。
2.如权利要求1所述的基于改进YOLOv3网络的野外山林环境目标检测方法,其特征在于,步骤一具体包括以下过程:利用python3+BeautifulSoup+requests+lxml在互联网上分别获取forest、valley、plain、wetland四个关键字的图片,数量分别为700、600、600、600,人工剔除其中不合适的图片;选取COCO2014数据集中的人和车的数据作为前景对象,通过在背景图中随机插入前景对象来构建野外山林环境数据集。
3.如权利要求1所述的基于改进YOLOv3网络的野外山林环境目标检测方法,其特征在于,步骤三具体包括以下过程:基于注意力机制的STL层的设计重点在于localizationnet,使其对于输入的特征图,输出6个参数来对原来的特征图进行仿射变换,以此来应对目标存在的旋转及尺度变化所导致的检测精度下降的问题;所以将STL嵌入到darknet-53的conv26,conv43和conv52特征图之后,既保证了通过STL层后,信息丢失量小,又保证了对旋转变化的敏感性,之后再对输出结果进行分类和回归损失计算。
4.如权利要求1所述的基于改进YOLOv3网络的野外山林环境目标检测方法,其特征在于,步骤四具体包括以下过程:de-STL层嵌入到图像目标位置卷积层之后,为的是方便计算location的损失;其中location的损失为:
其中,λcoord为损失系数,S是feature网格单元的数量,B为预测的box数量,定义为,如果网格单元i中存在目标,则第j个边界框预测值对该预测有效,此时为1;如果网格单元i中不存在目标,此时为0;xi,yi,分别代表着检测网络输出的目标预测位置以及宽高值,为目标在数据集中的位置以及宽高真值。
5.如权利要求1所述的基于改进YOLOv3网络的野外山林环境目标检测方法,其特征在于,步骤五具体为:
(1)YOLOv3模型中一共有9个anchor,3个不同尺度的输出,每个输出用3个anchor,所以输出的每个位置预测3个box;对于每个box来说,其输出的参数包括目标位置坐标以及宽高值,及该box有物体的置信分数和该box中为每类物体的概率;
(2)配置训练整个网络的损失函数为:
Loss=λ1Lossloc+λ2Lossconf+λ3Losscls
上式中,λ1为目标位置损失系数,λ2是目标置信度损失系数,λ3为目标类别损失系数;
目标置信度损失Lossconf采用的是二值交叉熵损失,用oi∈{0,1}表示预测目标边界框i中是否真实存在目标,0表示不存在,1表示存在;定义为,如果网格单元i中存在目标,则第j个边界框预测值对该预测有效,此时为1;如果网格单元i中不存在目标,此时为0,与之相反,如果网格单元i中存在目标,则第j个边界框预测值对该预测有效,此时为0;如果网格单元i中不存在目标,此时为1;λnoobj为当前网格无真实目标物的损失系数,λobj为当前网格有真实目标物的损失系数;表示预测目标矩形框i内是否存在目标的Sigmoid概率,ci代表真值,而目标置信度Lossconf的公式为:
目标类别损失Losscls同样采用的是二值交叉熵损失,其中,oij∈{0,1}表示预测目标边界框i中是否真实存在第j类目标,0表示不存在,1表示存在;表示网络预测目标边界框i内存在第j类目标的Sigmoid概率,Losscls的公式为:
(3)利用设计好的损失函数形式以及SGD的方法进行训练,梯度更新方式采用Adam方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011639547.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种显示儿童安全座椅状态图标的车载系统及方法
- 下一篇:一种多关节管道机器人