[发明专利]一种基于卷积神经网络的车辆前方目标识别方法在审
申请号: | 201710821353.1 | 申请日: | 2017-09-13 |
公开(公告)号: | CN107633220A | 公开(公告)日: | 2018-01-26 |
发明(设计)人: | 杨正才;高镇海;胡宏宇;何磊;吕科 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 长春吉大专利代理有限责任公司22201 | 代理人: | 杜森垚 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 车辆 前方 目标 识别 方法 | ||
1.一种基于卷积神经网络的车辆前方目标识别方法,其特征在于,包括以下步骤:
步骤一、从公开数据集中收集大量图像,分为原始训练样本和原始测试样本并分别制作分类标签;对原始训练样本和原始测试样本进行样本扩充和灰度化处理;
步骤二、搭建基于MATLAB平台的卷积神经网络结构,其由两层卷积层、两层池化层和三层全连接层构成;
步骤三、将扩充后的训练样本输入搭建好的卷积神经网络结构中进行训练,得到训练好的卷积神经网络;
步骤四、将扩充后的测试样本输入到训练好的卷积神经网络中,得到特征向量,再将特征向量输入到分类器进行分类,根据测试样本的类别标签与分类器的输出结果得出网络识别率。
2.如权利要求1所述的一种基于卷积神经网络的车辆前方目标识别方法,其特征在于,所述步骤一具体包括以下步骤:
1)获取车辆前方目标样本:从MIT数据集和KITTI数据集中收集大量图像,一部分图像作为原始训练样本,其余的图像作为原始测试样本;原始训练样本和原始测试样本图像内容包括车辆图像、行人图像及其他类别的交通相关图像,将车辆图像和行人图像作为正样本并制作标签,将其他类别的交通相关图像作为负样本并制作标签;
2)扩充样本数据:将原始训练样本和原始测试样本中每个图像进行水平镜像变换,每次变换产生一个新的图像,在新的图像上标记与原始图像相同的标签,得到图像数量扩充后的训练样本和测试样本;
3)样本数据灰度化:对扩充后的训练样本和测试样本的每个图像进行灰度化,将三个彩色通道合并成一个灰度通道,并将像素值进行归一化。
3.如权利要求2所述的一种基于卷积神经网络的车辆前方目标识别方法,其特征在于,所述步骤1)获取车辆前方目标样本后,原始训练样本为2000张50*50像素大小的图像,待识别物体在图像中心;原始测试样本为500张50*50像素大小的图像,待识别物体在图像中心。
4.如权利要求2所述的一种基于卷积神经网络的车辆前方目标识别方法,其特征在于,所述步骤3)样本数据灰度化的具体方法为:根据公式Gray=0.11B+0.59G+0.3R分别对扩充后的训练样本和测试样本的每个图像进行灰度化;式中,B为蓝色通道的像素值;G为绿色通道的像素值;R为红色通道的像素值;Gray为最后的灰色单通道的像素值。
5.如权利要求1所述的一种基于卷积神经网络的车辆前方目标识别方法,其特征在于,所述步骤二搭建基于MATLAB平台的卷积神经网络结构的具体步骤为:
第一层为第一次卷积层,用于对50*50*1*n的输入数据进行卷积操作,n表示输入样本的数量,第一层的卷积核窗口大小为5*5,输出9个特征图;经第一层得到的特征图输入到第二层;
第二层为第一次池化层,用于对第一层的每个特征图进行降维,第二层的核窗口大小为2*2,经池化后得到降维的特征图并输入到第三层;
第三层为第二次卷积层,用于对第二层得到的特征图进行卷积操作,该卷积层的卷积核窗口大小为4*4,输出18个特征图;经第三层得到的特征图输入到第四层;
第四层为第二次池化层,用于对第三层的每个特征图进行降维,第四层的核窗口大小为2*2,经第四层池化后得到降维的特征图并输入到第五层;
第五层是第一次全连接层,第五层有100个神经元,用于将输入的特征图变换成一个n维列向量,n维列向量与第五层全连接层的权值矩阵和偏置进行非线性变换得到一个100维列向量输入到第六层;
第六层是第二次全连接层,第六层有200个神经元,用于将输入的100维列向量与五六层全连接层的权值矩阵和偏置进行非线性变换得到一个200维列向量后输入到第七层;
第七层是输出层,第七层有3个神经元,用于作最后的输出分类。
6.如权利要求1所述的一种基于卷积神经网络的车辆前方目标识别方法,其特征在于,所述步骤三具体包括以下步骤:
5)将扩充后的训练样本输入所述步骤二搭建的卷积神经网络结构中,进行正向传播,得到分类结果;
6)将所述步骤5)的分类结果与训练样本的分类标签进行比较,求出残差和识别误差,进行反向传播,更新权值;
7)重复所述步骤5)和步骤6),直到识别误差不再下降,得到训练好的卷积神经网络。
7.如权利要求1所述的一种基于卷积神经网络的车辆前方目标识别方法,其特征在于,所述步骤四具体包括以下步骤:
8)将扩充后的测试样本输入到步骤7)训练好的卷积神经网络中,每个测试样本得到一个三维的特征向量:x=(x1,x2,x3);
9)将三维特征向量x输入到三类分类器中进行分类,分别计算出测试样本图像所属三类的概率;
10)取概率最大值对应的标签与测试样本的分类标签做对比,得出网络识别率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710821353.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一体化光学字符识别方法和系统
- 下一篇:一种基于机器视觉的鱼类行为量化系统