[发明专利]基于轻量级卷积神经网络的目标检测方法有效
申请号: | 201911027640.0 | 申请日: | 2019-10-28 |
公开(公告)号: | CN110781962B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 谢雪梅;金星;石光明 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 轻量级 卷积 神经网络 目标 检测 方法 | ||
1.一种基于轻量级卷积神经网络的目标检测方法,其特征在于,利用构建一个轻量级卷积神经网络提取并增强目标特征,并将网络输出的向量与类别和位置相对应,对图像数据集中的目标进行识别与定位,该方法的步骤包括如下:
步骤1,构建轻量级卷积神经网络:
第一步,搭建一个9层的特征提取模块,其结构依次为:第一卷积层→第二卷积层→第一池化层→第三卷积层→第四卷积层→第二池化层→第五卷积层→第六卷积层→第七卷积层;并设置每层参数为:将第一至第七卷积层中卷积核的个数分别设置为64,64,128,128,256,256,256,卷积核的大小均设置为3×3,步长均设置为1,第一和第二池化层均采用最大池化的方式,池化区域核的大小均设置为2×2,步长均设置为2;
第二步,搭建一个3层的特征增强模块,其结构依次为:全局平均池化层→归一化层→点积层,其中点积层与全局平均池化层和归一化层并联;并将池化区域核的大小设置为2×2,步长设置为2;分别定义全局平均池化、归一化层和点积层的函数;
第三步,搭建一个3层的识别和定位模块,其结构依次为:第八卷积层→第九卷积层→第十卷积层;其中第九卷积层和第十卷积层并联;并将第八、九、十卷积层中卷积核的个数分别设置为256,2,8,卷积核的大小均设置为3×3,步长均设置为1;
第四步,将特征提取模块、特征增强模块、识别和定位模块依次连接组成轻量级卷积神经网络;
步骤2,生成目标训练集:
第一步,将至少1500张含有目标的待检测图片组成图片数据集,所述的每张待检测图片是从连续拍摄的含有待检测目标的视频中每隔5帧组成大小为1920×1080×3的一张图片;
第二步,对图片数据集中的每张图片中的目标进行标注,标注出目标所在的每个外接矩形框的各顶点坐标和其代表的类别,标注后会对应生成一个含有各目标各顶点坐标和其类别信息的xml格式标注文件;将所有的图片放到名为JPEGImages的文件夹中,将所有的xml格式的标注文件放到Annotations文件夹中,组成训练集;
步骤3,训练轻量级卷积神经网络:
将训练集输入到轻量级卷积神经网络中,用梯度下降法更新轻量级卷积神经网络的权值,直至Loss值降至3.0以下为止,得到训练好的轻量级卷积神经网络;
步骤4,对待检测目标进行检测:
将含有待检测目标的每张图片依次输入到训练好的轻量级卷积神经网络中,输出对图片中待检测目标的类别和目标所在的每个外接矩形框位置的检测结果。
2.根据权利要求1所述的基于轻量级卷积神经网络的目标检测方法,其特征在于,步骤1第二步中所述的全局平均池化层的函数如下:
其中,zi表示全局平均池化层输出的第i个特征权重,i=1,2,...,C,C表示X的总维度数,C=256,Fglobal表示全局平均池化操作,X表示从特征提取模块提取并向全局平均池化层输入的一组特征图,H和W分别表示X的高度和宽度,m和n分别表示横轴坐标和纵轴坐标,该坐标系以特征图左上角为原点,水平向右为横轴正方向,垂直向下为纵轴正方向,xi(m,n)表示X中第i个特征图中坐标为(m,n)的点的值。
3.根据权利要求1所述的基于轻量级卷积神经网络的目标检测方法,其特征在于,步骤1第二步中所述的归一化层的函数如下:
其中,si表示更新后的第i个特征权重。
4.根据权利要求1所述的基于轻量级卷积神经网络的目标检测方法,其特征在于,步骤1第二步中所述的点积层的函数如下:
其中,表示特征图X中坐标为xi(m,n)的像素点与其对应的更新后的特征权重。
5.根据权利要求1所述的基于轻量级卷积神经网络的目标识别方法,其特征在于,步骤3中所述的Loss函数定义为:
式中,i是一个mini-batch下anchor的索引。pi是anchor预测为目标的概率。当anchor为目标时,为1,否则为0。ti是预测框的位置坐标,/是训练时每一个positive anchor对应的ground truth的坐标。Ncls是一个batch的大小,设为256。Nreg是anchor的总数,λ是为了平衡二者设置的平衡比例,设置/Lcls是目标与非目标的对数损失,即
Lreg则采用FastR-CNN中的平滑L1 loss,其形式为
其中,R即为Smooth L1 Loss函数,即
表示Loss只正样本回归时有效。/
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911027640.0/1.html,转载请声明来源钻瓜专利网。