[发明专利]一种基于卷积神经网络的车辆前方目标识别方法在审
申请号: | 201710821353.1 | 申请日: | 2017-09-13 |
公开(公告)号: | CN107633220A | 公开(公告)日: | 2018-01-26 |
发明(设计)人: | 杨正才;高镇海;胡宏宇;何磊;吕科 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 长春吉大专利代理有限责任公司22201 | 代理人: | 杜森垚 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 车辆 前方 目标 识别 方法 | ||
技术领域
本发明属于汽车高级驾驶辅助系统(Advanced Driver Assistant System,简称ADAS)领域及车辆无人驾驶领域,是一种基于卷积神经网络的车辆前方目标识别方法,可以对车辆前方障碍物进行分类的方法,可以较好地对前方车辆及行人进行分类识别。
背景技术
近年来高级驾驶辅助系统市场增长迅速,高级驾驶辅助系统利用安装在车上的各式各样传感器,在汽车行驶过程中随时感应周围的环境,收集数据,进行静态、动态物体的辨识、侦测与追踪,并结合导航仪地图数据,进行系统的运算与分析,从而预先让驾驶者察觉到可能发生的危险,或者对车辆进行主动控制,有效增加汽车驾驶的舒适性和安全性,ADAS系统是减少经济损失和提高驾驶车辆安全性的重要保障之一。
车辆前方目标物体的有效识别作为高级驾驶辅助系统中至关重要的一环,受到了各大研究机构和学者的广泛关注,已成为汽车智能驾驶技术领域的研究热点。车辆前方障碍物的识别问题,一般采用激光雷达、毫米波雷达及多传感器融合等几种方案。其中,激光雷达的探测性能容易受到天气,尤其是恶劣天气如雨、雪、雾的影响。毫米波雷达传播损耗比低频段严重,探测波会引入大量的噪声和干扰。因此目前国内外一般采用激光雷达、毫米波雷达等传感器与视觉传感器进行数据融合的方案,使用基于模型匹配和人工提取特征的方法。而视觉传感器很容易受到摄像头拍摄角度、复杂背景和障碍物重叠等因素的干扰,无法保证一个较高的识别成功率。本发明旨在利用卷积神经网络对视觉传感器信息进行图像提取、分类等工作,较好地提高了车辆前方目标的识别率。
发明内容
为了解决现有技术存在的以上问题,本发明提供一种基于卷积神经网络的车辆前方目标识别方法,是一种基于MATLAB平台开发的利用卷积神经网络识别和分类车辆前方障碍物的算法。卷积神经网络能够模拟人类的视觉系统,自动提取图像特征并通过反复的训练学习,对图像进行分类,与其它分类器的算法相比,卷积神经网络具有相对较高的识别准确率,且对图像的平移、扭曲和旋转有一定程度的适应能力,将卷积神经网络应用于车辆前方障碍物的识别和分类上能够较大幅度地提升道路交通事故的发生率。
本发明的目的是通过以下技术方案实现的:
一种基于卷积神经网络的车辆前方目标识别方法,包括以下步骤:
步骤一、从公开数据集中收集大量图像,分为原始训练样本和原始测试样本并分别制作分类标签;对原始训练样本和原始测试样本进行样本扩充和灰度化处理;
步骤二、搭建基于MATLAB平台的卷积神经网络结构,其由两层卷积层、两层池化层和三层全连接层构成;
步骤三、将扩充后的训练样本输入搭建好的卷积神经网络结构中进行训练,得到训练好的卷积神经网络;
步骤四、将扩充后的测试样本输入到训练好的卷积神经网络中,得到特征向量,再将特征向量输入到分类器进行分类,根据测试样本的类别标签与分类器的输出结果得出网络识别率。
进一步地,所述步骤一具体包括以下步骤:
1)获取车辆前方目标样本:从MIT数据集和KITTI数据集中收集大量图像,一部分图像作为原始训练样本,其余的图像作为原始测试样本;原始训练样本和原始测试样本图像内容包括车辆图像、行人图像及其他类别的交通相关图像,将车辆图像和行人图像作为正样本并制作标签,将其他类别的交通相关图像作为负样本并制作标签;
2)扩充样本数据:将原始训练样本和原始测试样本中每个图像进行水平镜像变换,每次变换产生一个新的图像,在新的图像上标记与原始图像相同的标签,得到图像数量扩充后的训练样本和测试样本;
3)样本数据灰度化:对扩充后的训练样本和测试样本的每个图像进行灰度化,将三个彩色通道合并成一个灰度通道,并将像素值进行归一化。
进一步地,所述步骤二搭建基于MATLAB平台的卷积神经网络结构的具体步骤为:
第一层为第一次卷积层,用于对50*50*1*n的输入数据进行卷积操作,n表示输入样本的数量,第一层的卷积核窗口大小为5*5,输出9个特征图;经第一层得到的特征图输入到第二层;
第二层为第一次池化层,用于对第一层的每个特征图进行降维,第二层的核窗口大小为2*2,经池化后得到降维的特征图并输入到第三层;
第三层为第二次卷积层,用于对第二层得到的特征图进行卷积操作,该卷积层的卷积核窗口大小为4*4,输出18个特征图;经第三层得到的特征图输入到第四层;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710821353.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一体化光学字符识别方法和系统
- 下一篇:一种基于机器视觉的鱼类行为量化系统