[发明专利]一种轻量级车辆与行人的检测方法在审
申请号: | 202010629326.6 | 申请日: | 2020-07-03 |
公开(公告)号: | CN111814863A | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 闫胜业;倪一华;张超 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06N3/04 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210004 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 轻量级 车辆 行人 检测 方法 | ||
1.一种轻量级车辆与行人的检测方法,其特征在于,包括以下步骤:
(1)对人、车两类图像数据进行预处理,并将图像数据按比例划分为训练集和测试集;
(2)构建基于改进的Yolov3-tiny为检测模型:
利用反残差网络结构结合多尺度可分离卷积对特征提取网络改进,利用瓶颈层对通道维度进行缩放,将通道划分为若干组,并对每组应用不同的卷积核大小;将多尺度特征的组合方式改进为双向双输入特征融合方法,对只有一个输入边的节点进行改进,确保每一个节点都有两个尺度的特征输入,并将自上而下与自下而上混合使用;在检测网络引入自注意力机制,利用自注意力模块交错执行特征聚合和特征变换实现特征重标定;
(3)在步骤(2)构建的检测网络上使用训练集进行模型训练,确定最优模型,并进行图像检测。
2.根据权利要求1所述的轻量级车辆与行人的检测方法,其特征在于,所述步骤(1)中的预处理为单样本与多样本结合的的数据增强方法,具体包括:
(11)单样本的数据增强包括颜色操作和几何操作:
所述原则操作为通过颜色直方图变换、对比度改变及亮度整体变换来改变图像中物体不同部位的颜色;所述几何操作是通过随机旋转、翻转、裁剪后的几何扭曲来改变图像中对象不同位置和尺度,进而改变图像像素内容;
(12)多样本数据增强采用基于邻域风险最小化原则的数据增强方法,采用线性插值得到新样本数据,令(xn,yn)为插值生成的新数据,(xi,yi),(xj,yj)是训练集中选取的两个数据,则数据生成操作如下:
(xn,yn)=λ(xi,yi)+(1-λ)(xj,yj)
其中,xi表示第i个数据,yi表示第i个数据的标签。λ表示插值系数,λ的取值范围是0到1。
3.根据权利要求1所述的轻量级车辆与行人的检测方法,其特征在于,所述步骤(1)预处理前的图像为PNG格式,尺寸为416×416。
4.根据权利要求1所述的轻量级车辆与行人的检测方法,其特征在于,所述步骤(2)的利用反残差结构结合多尺度可分离卷积具体包括以下步骤:
首先将特征图输入,经过瓶颈层来扩张特征图的维度,扩张系数为e,其次将扩张后的特征张量划分为g组虚拟张量其中所有的虚拟张量具有相同的空间高度h和宽度w,其总通道大小等于扩张后的输入张量通道的大小,即c1+c2+...cg=c·e;其中,c表示原始通道数,e表示通道扩张系数;
同样,将卷积内核分为g组虚拟内核其中第n组相应的虚拟张量输出计算如下:
其中,k1……kg分别表示第1~g组虚拟卷积核的尺寸,c1……cg分别表示第1~g组虚拟卷积核输入通道数,v表示每个虚拟内核的输出通道数,z表示输出通道数,在本式中表示预测输出通道数;
输出张量是所有虚拟输出张量的通道的叠加计算方式为:
其中,zo=z1+...zg=m·e,在本式中,z0表示虚拟卷积核输出通道数的和,z1……zg表示其中任意一个虚拟卷积核输出通道,m表示原始输入的通道维度;最终将叠加后的特征向量再次送入瓶颈层,通过瓶颈层改变通道维度,得到最终的特征输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010629326.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种厚胶涂布除静电装置
- 下一篇:一种气相法处理柳木木材的方法