[发明专利]基于多分辨率神经网络的车库自动驾驶语义目标识别方法在审
申请号: | 201710589942.1 | 申请日: | 2017-07-19 |
公开(公告)号: | CN107563405A | 公开(公告)日: | 2018-01-09 |
发明(设计)人: | 张绍明;熊璐;吴睿泽;阳群益 | 申请(专利权)人: | 同济大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 上海科盛知识产权代理有限公司31225 | 代理人: | 赵志远 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分辨率 神经网络 车库 自动 驾驶 语义 目标 识别 方法 | ||
技术领域
本发明涉及语义识别领域,尤其是涉及一种基于多分辨率神经网络的车库自动驾驶语义目标识别方法。
背景技术
目前,基于神经网络的目标检测方法几乎取代了传统方法。尤其是在图像上对多类目标进行语义识别时,只有深度学习方法能够达到实际应用的检测标准。但是基于神经网络的目标检测方法有一个普遍的难题,就是对多分辨率、多尺度的目标,尤其是小目标(小于图像宽度/下采样倍数)的检测,神经网络在卷积网特征提取时,因下采样倍数高导致小目标丢失。
现有的效果较好的多分辨率网络如MSCNN,占用内存是普通网络的3倍,但是能检测的最小目标尺寸只有原图长或宽的0.067倍。
另一个流行的多分辨率网络是SSD,它在检测前对输入图像就下次样到固定大小(300*300),实际能检测的目标尺度范围是原图长或宽的0.1至0.8倍。
两者支持的目标尺度范围不能满足应用,且前者硬件要求、计算代价大,后者对分辨率较高的图像信息利用太低。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种适用于高分辨率图片、多分辨率描述、多尺度描述、检测能力强的基于多分辨率神经网络的车库自动驾驶语义目标识别方法。
本发明的目的可以通过以下技术方案来实现:
一种基于多分辨率神经网络的车库自动驾驶语义目标识别方法,用以检测车库图像中的目标,包括以下步骤:
1)对输入的车库图像进行深度卷积网特征提取;
2)对输入的车库图像中的小目标进行特征提取与检测;
3)对输入的车库图像中的大目标进行特征提取与检测;
4)输出多尺度的检测结果。
所述的步骤1)具体包括以下步骤:
101)将输入的车库图像缩放为1056×640像素;
102)对缩放后的图像以7×7的卷积核、步长为2进行32次卷积,获得32通道、529×320的卷积特征图,对卷积特征图上的每个像素采用C.ReLU激活函数模块处理,卷积特征图通道数和尺寸不变;
103)对步骤102)得到的卷积特征图,采用3×3的卷积核且以步长为2进行最大值池化,得到32通道、264×160的卷积特征图;
104)对步骤103)得到的卷积特征图,采用3×3的卷积核且以步长为1进行64次卷积,对卷积特征图上的每个像素采用C.ReLU激活函数模块处理,并重复三次,得到64通道、264×160的卷积特征图;
105)对步骤104)得到的卷积特征图,采用3×3的卷积核且以步长为2进行128次卷积,对卷积特征图上的每个像素采用C.ReLU激活函数模块处理,得到128通道、132×80的卷积特征图;
106)对步骤105)得到的卷积特征图,采用3×3的卷积核且步长为1进行128次卷积,对卷积特征图上的每个像素采用C.ReLU激活函数模块处理,并重复三次,得到128通道、132×80的卷积特征图;
107)将步骤106)得到的卷积特征图,采用步长为2的改进Inception模块处理,得到256通道、66×40的卷积特征图;
108)将步骤107)得到的卷积特征图,经过三个步长为1,通道数不变的改进Inception模块处理,得到256通道、66×40的卷积特征图;
109)将步骤108)得到的卷积特征图,经过步长为2的改进Inception模块处理,得到384通道、33×20的卷积特征图;
110)将步骤109)的卷积特征图采用步长为1、通道数不变的三个改进Inception模块处理,得到384通道、33×20的卷积特征图。
所述的步骤2)具体包括以下步骤:
301)对步骤104)获得的卷积特征图进行下采样一倍,得到64通道、132×80的特征图;
302)将步骤108)获得的卷积特征图进行上采样一倍,得到256通道、132×80的特征图;
303)将步骤301)、步骤302)以及步骤106)获得的卷积特征图进行特征通道串联,得到448通道、132×80的卷积特征图;
304)通过区域建议网产生兴趣区,将兴趣区与步骤303)获得的卷积特征图进行对应,得到兴趣区特征;
305)将步骤304)的兴趣区特征经过两个全连接层后连接一个分类器和一个回归器;
306)通过分类器获取车库图像中小目标属于各类别的概率,通过回归器获取小目标检测矩形框的像素坐标修正参数。
所述的步骤3)具体包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710589942.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种交通标志分类方法及装置
- 下一篇:一种自主学习的图像精细分类方法