[发明专利]基于轻量化残差学习和反卷积级联的自适应目标检测方法在审
申请号: | 202011342607.X | 申请日: | 2020-11-26 |
公开(公告)号: | CN112348036A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 刘芳;韩笑;孙亚楠 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 量化 学习 卷积 级联 自适应 目标 检测 方法 | ||
1.基于轻量化残差学习和反卷积级联的自适应目标检测方法,其特征在于:
S1:通过图像采集设备采集数据,获取图像训练数据集和测试数据集;
S2:构建轻量化深度残差网络,输入S1中的图像训练数据集和测试数据集,进行特征提取;
S3:选取轻量化残差网络中后四个层级中提取到的特征图,用1x1卷积固定输出特征图维度;
S4:构建多尺度自适应候选区域生成网络,由于不同层级网络得到的特征图尺寸不同,前一层特征图尺寸大于当前层特征图,为了将不同层级特征图融合,将S3中提取到的不同尺寸的特征图利用反卷积级联结构增大特征图的分辨率,实现与其前一层特征图的空间尺寸一致,并将特征图按照通道维度进行加权融合操作,采用候选区域生成网络产生预测目标框和类别信息;
S5:通过自适应候选区域生成的预测目标框的位置和类别信息,采用如下公式的多任务损失函数进行位置修正和类别回归;
L=Lcls+Lreg+β1Lloc+β2Lshape (1)
其中,L为算法总的损失函数,Lcls表示在对特征进行分类时的分类损失函数,Lreg表示在进行位置回归时的回归损失函数,Lloc表示对目标定位时的定位损失,Lshape表示目标检测框的形状损失,β1和β2分别表示多任务损失函数的加权系数,分别取1和0.1。
2.根据权利要求1所述的基于轻量化残差学习和反卷积级联的自适应目标检测方法,其特征在于:
S1中,通过图像采集设备采集数据,获取图像训练数据集和测试数据集;
S1.1:对数据集中的样本通过裁剪、翻转、旋转、尺度变换预处理,扩充数据集;
S1.2:提取每个图像中的正负样本,对待检测的正样本进行标注,用矩形框标出每个目标的位置和类别。
3.根据权利要求1所述的基于轻量化残差学习和反卷积级联的自适应目标检测方法,其特征在于:S2中,构建轻量化深度残差网络,输入训练数据集,进行特征提取;
具体分为以下几个步骤:
S2.1:将训练数据集输入到轻量化残差网络中,对图像进行深度可分离卷积;
1)对输入图像进行深度卷积,将输入图像特征F的N个通道中的每一个通道单独分配一个卷积核,每个卷积核只负责对该通道的图像特征进行卷积操作,其中卷积核大小与标准卷积的卷积核大小一致,个数为N,步长为1,包含padding操作;
2)将上一步中的通过深度卷积得到的特征图进行点卷积,卷积核尺寸为1×1,个数为L,得到指定通道维度的特征图;
S2.2:通过跳跃连接的方式连接浅层网络与深层网络,将经过卷积过后的不同层级的特征图的特征信息进行融合,相当于把底层的特征信息融合到高层中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011342607.X/1.html,转载请声明来源钻瓜专利网。