[发明专利]基于多分辨率神经网络的车库自动驾驶语义目标识别方法在审
申请号: | 201710589942.1 | 申请日: | 2017-07-19 |
公开(公告)号: | CN107563405A | 公开(公告)日: | 2018-01-09 |
发明(设计)人: | 张绍明;熊璐;吴睿泽;阳群益 | 申请(专利权)人: | 同济大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 上海科盛知识产权代理有限公司31225 | 代理人: | 赵志远 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分辨率 神经网络 车库 自动 驾驶 语义 目标 识别 方法 | ||
1.一种基于多分辨率神经网络的车库自动驾驶语义目标识别方法,用以检测车库图像中的目标,其特征在于,包括以下步骤:
1)对输入的车库图像进行深度卷积网特征提取;
2)对输入的车库图像中的小目标进行特征提取与检测;
3)对输入的车库图像中的大目标进行特征提取与检测;
4)输出多尺度的检测结果。
2.根据权利要求1所述的一种基于多分辨率神经网络的车库自动驾驶语义目标识别方法,其特征在于,所述的步骤1)具体包括以下步骤:
101)将输入的车库图像缩放为1056×640像素;
102)对缩放后的图像以7×7的卷积核、步长为2进行32次卷积,获得32通道、529×320的卷积特征图,对卷积特征图上的每个像素采用C.ReLU激活函数模块处理,卷积特征图通道数和尺寸不变;
103)对步骤102)得到的卷积特征图,采用3×3的卷积核且以步长为2进行最大值池化,得到32通道、264×160的卷积特征图;
104)对步骤103)得到的卷积特征图,采用3×3的卷积核且以步长为1进行64次卷积,对卷积特征图上的每个像素采用C.ReLU激活函数模块处理,并重复三次,得到64通道、264×160的卷积特征图;
105)对步骤104)得到的卷积特征图,采用3×3的卷积核且以步长为2进行128次卷积,对卷积特征图上的每个像素采用C.ReLU激活函数模块处理,得到128通道、132×80的卷积特征图;
106)对步骤105)得到的卷积特征图,采用3×3的卷积核且步长为1进行128次卷积,对卷积特征图上的每个像素采用C.ReLU激活函数模块处理,并重复三次,得到128通道、132×80的卷积特征图;
107)将步骤106)得到的卷积特征图,采用步长为2的改进Inception模块处理,得到256通道、66×40的卷积特征图;
108)将步骤107)得到的卷积特征图,经过三个步长为1,通道数不变的改进Inception模块处理,得到256通道、66×40的卷积特征图;
109)将步骤108)得到的卷积特征图,经过步长为2的改进Inception模块处理,得到384通道、33×20的卷积特征图;
110)将步骤109)的卷积特征图采用步长为1、通道数不变的三个改进Inception模块处理,得到384通道、33×20的卷积特征图。
3.根据权利要求2所述的一种基于多分辨率神经网络的车库自动驾驶语义目标识别方法,其特征在于,所述的步骤2)具体包括以下步骤:
301)对步骤104)获得的卷积特征图进行下采样一倍,得到64通道、132×80的特征图;
302)将步骤108)获得的卷积特征图进行上采样一倍,得到256通道、132×80的特征图;
303)将步骤301)、步骤302)以及步骤106)获得的卷积特征图进行特征通道串联,得到448通道、132×80的卷积特征图;
304)通过区域建议网产生兴趣区,将兴趣区与步骤303)获得的卷积特征图进行对应,得到兴趣区特征;
305)将步骤304)的兴趣区特征经过两个全连接层后连接一个分类器和一个回归器;
306)通过分类器获取车库图像中小目标属于各类别的概率,通过回归器获取小目标检测矩形框的像素坐标修正参数。
4.根据权利要求2所述的一种基于多分辨率神经网络的车库自动驾驶语义目标识别方法,其特征在于,所述的步骤3)具体包括以下步骤:
401)对步骤106)获得的卷积特征图进行下采样一倍,得到128通道、66×40的卷积特征图;
402)对步骤110)获得的卷积特征图进行上采样一倍,得到384通道、66×40的卷积特征图;
403)对步骤301)、步骤302)以及步骤108)获得的卷积特征图进行特征通道串联,得到768通道、66×40的特征图;
404)通过区域建议网产生兴趣区,将兴趣区与步骤403)获得的卷积特征图进行对应,得到兴趣区特征;
405)将步骤404)的兴趣区特征经过两个全连接层连接一个分类器和一个回归器;
406)通过分类器获取车库图像中大目标属于各类别的概率,通过回归器获取大目标检测矩形框的像素坐标修正参数。
5.根据权利要求2所述的一种基于多分辨率神经网络的车库自动驾驶语义目标识别方法,其特征在于,所述的步骤1)中,改进Inception模块是基于Inception v2模块、采用用3×3的卷积方式实现最大值池化,在Inception v2模块得到的卷积特征图后,增加加一个通道数不变、卷积核为1×1的卷积层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710589942.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种交通标志分类方法及装置
- 下一篇:一种自主学习的图像精细分类方法