[发明专利]基于多分辨率神经网络的车库自动驾驶语义目标识别方法在审

申请号：	201710589942.1	申请日：	2017-07-19
公开（公告）号：	CN107563405A	公开（公告）日：	2018-01-09
发明（设计）人：	张绍明;熊璐;吴睿泽;阳群益	申请（专利权）人：	同济大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04
代理公司：	上海科盛知识产权代理有限公司31225	代理人：	赵志远
地址：	200092 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于分辨率神经网络车库自动驾驶语义目标识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及语义识别领域，尤其是涉及一种基于多分辨率神经网络的车库自动驾驶语义目标识别方法。

背景技术

目前，基于神经网络的目标检测方法几乎取代了传统方法。尤其是在图像上对多类目标进行语义识别时，只有深度学习方法能够达到实际应用的检测标准。但是基于神经网络的目标检测方法有一个普遍的难题，就是对多分辨率、多尺度的目标，尤其是小目标(小于图像宽度/下采样倍数)的检测，神经网络在卷积网特征提取时，因下采样倍数高导致小目标丢失。

现有的效果较好的多分辨率网络如MSCNN，占用内存是普通网络的3倍，但是能检测的最小目标尺寸只有原图长或宽的0.067倍。

另一个流行的多分辨率网络是SSD，它在检测前对输入图像就下次样到固定大小(300*300)，实际能检测的目标尺度范围是原图长或宽的0.1至0.8倍。

两者支持的目标尺度范围不能满足应用，且前者硬件要求、计算代价大，后者对分辨率较高的图像信息利用太低。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种适用于高分辨率图片、多分辨率描述、多尺度描述、检测能力强的基于多分辨率神经网络的车库自动驾驶语义目标识别方法。

本发明的目的可以通过以下技术方案来实现：

一种基于多分辨率神经网络的车库自动驾驶语义目标识别方法，用以检测车库图像中的目标，包括以下步骤：

1)对输入的车库图像进行深度卷积网特征提取；

2)对输入的车库图像中的小目标进行特征提取与检测；

3)对输入的车库图像中的大目标进行特征提取与检测；

4)输出多尺度的检测结果。

所述的步骤1)具体包括以下步骤：

101)将输入的车库图像缩放为1056×640像素；

102)对缩放后的图像以7×7的卷积核、步长为2进行32次卷积，获得32通道、529×320的卷积特征图，对卷积特征图上的每个像素采用C.ReLU激活函数模块处理，卷积特征图通道数和尺寸不变；

103)对步骤102)得到的卷积特征图，采用3×3的卷积核且以步长为2进行最大值池化，得到32通道、264×160的卷积特征图；

104)对步骤103)得到的卷积特征图，采用3×3的卷积核且以步长为1进行64次卷积，对卷积特征图上的每个像素采用C.ReLU激活函数模块处理，并重复三次，得到64通道、264×160的卷积特征图；

105)对步骤104)得到的卷积特征图，采用3×3的卷积核且以步长为2进行128次卷积，对卷积特征图上的每个像素采用C.ReLU激活函数模块处理，得到128通道、132×80的卷积特征图；

106)对步骤105)得到的卷积特征图，采用3×3的卷积核且步长为1进行128次卷积，对卷积特征图上的每个像素采用C.ReLU激活函数模块处理，并重复三次，得到128通道、132×80的卷积特征图；

107)将步骤106)得到的卷积特征图，采用步长为2的改进Inception模块处理，得到256通道、66×40的卷积特征图；

108)将步骤107)得到的卷积特征图，经过三个步长为1，通道数不变的改进Inception模块处理，得到256通道、66×40的卷积特征图；

109)将步骤108)得到的卷积特征图，经过步长为2的改进Inception模块处理，得到384通道、33×20的卷积特征图；

110)将步骤109)的卷积特征图采用步长为1、通道数不变的三个改进Inception模块处理，得到384通道、33×20的卷积特征图。

所述的步骤2)具体包括以下步骤：

301)对步骤104)获得的卷积特征图进行下采样一倍，得到64通道、132×80的特征图；

302)将步骤108)获得的卷积特征图进行上采样一倍，得到256通道、132×80的特征图；

303)将步骤301)、步骤302)以及步骤106)获得的卷积特征图进行特征通道串联，得到448通道、132×80的卷积特征图；

304)通过区域建议网产生兴趣区，将兴趣区与步骤303)获得的卷积特征图进行对应，得到兴趣区特征；

305)将步骤304)的兴趣区特征经过两个全连接层后连接一个分类器和一个回归器；

306)通过分类器获取车库图像中小目标属于各类别的概率，通过回归器获取小目标检测矩形框的像素坐标修正参数。

所述的步骤3)具体包括以下步骤：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于同济大学，未经同济大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710589942.1/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于多分辨率神经网络的车库自动驾驶语义目标识别方法在审

专利文献下载