[发明专利]一种基于快速二分卷积神经网络的层次化交通标识识别方法在审
申请号: | 201711373435.0 | 申请日: | 2017-12-19 |
公开(公告)号: | CN108009518A | 公开(公告)日: | 2018-05-08 |
发明(设计)人: | 葛宏伟;赵明德;杨心 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 温福雪;侯明远 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于计算机应用及计算视觉技术领域,提供了一种基于快速二分卷积神经网络的层次化交通标识识别方法。本发明设计了快速二分卷积神经网络结构以缓解卷积过程的计算量大与耗时问题,并提出了基于快速卷积神经网络的层次化分类算法。具体应用上,在粗分类阶段,首先对交通标识图像进行预处理得到感兴趣区域,然后将感兴趣区域输入到快速二分卷积神经网络粗分为若干大类;在细分类阶段,针对各类的特点对交通标识进行再次预处理,对处理后的标识进一步利用快速二分卷积网络进行细分类得出最终结果。结果表明,提出的算法不仅具有较高的分类正确率,同时具有较快的处理速度,更加适用于实时性要求较高的交通标识识别系统。 | ||
搜索关键词: | 一种 基于 快速 二分 卷积 神经网络 层次 交通 标识 识别 方法 | ||
【主权项】:
1.一种基于快速二分卷积神经网络的层次化交通标识识别方法,其特征在于,步骤如下:第一步,快速二分卷积神经网络本方法提出的快速二分卷积神经网络在结构上与传统卷积神经网络CNN相似,但卷积和采样的过程不同;在卷积过程中,采用二分卷积模式,即一张特征图只卷积生成两张映射图;在采样过程中,本方法使用多种采样方法,包括最大值采样和平均值采样,从而使采样得到的特征图具有更丰富的特征表达;(1)二分卷积层在卷积层采用二分结构,一张特征图只卷积生成两张映射图;(2)多采样层在采样过程中,增加少量的高斯噪声以提高局部区域的采样稳定性,采样层对特征图的处理方式如下:O=(∑∑I(i,j)P ×G(i,j))1/P , (1)其中,I表示输入图像,G代表高斯核,O为输出图像;当P=1,为均值采样;当P→∞时,为最大值采样;本方法同时采用最大值采样和均值采样;(3)加速分析采用浮点操作次数FLOPS来衡量CNN的计算量,对于CNN计算第l卷积层的计算量,公式如下: FLOPS l = S 2 · | P l - 1 | · | P l | · w l 2 · k l 2 · 2 - - - ( 2 ) ]]> 其中,S2 是输入图片的像素个数,对于卷积层l,|Pl |表示特征图个数, 表示每个特征图的像素个数, 是卷积核的总像素数;二分卷积层不需要选择输入图像,每张输入图像直接卷积生成两个特征图,使用两个不同的卷积核,同样,每张输入图像经过多采样层生成k个特征图,k表示采样核个数;本方法采用最大值和均值采样,k值为2;因此,提出的快速二分卷积网络每层产生的特征图个数为F0 ×2l ,其中,F0 为输入层的图像个数,l表示层数;第二步,基于快速卷积神经网络的交通标识层次化分类算法(1)粗分类阶段图像预处理在对交通标识进行识别前,需增强与复原高价值区域,为接下来的处理过程提供高质量的输入图像,使得交通标识的定位分割、特征提取以及匹配识别的复杂度和难度减少,从而有效地提升系统的准确率和处理速度;首先将原始RGB图像映射到灰度图像,以降低对不同光照条件引起的色差的敏感度,进而通过多尺度模板匹配在灰度图像上提取包含交通标识的感兴趣的区域ROI;(2)快速二分卷积神经网络对ROIs进行特征提取将得到的ROIs输入到快速二分卷积神经网络进行粗分类;在卷积过程中,一张特征图只卷积生成两张映射图;设计的卷积网络为8层网络:第1层为卷积核大小7×7的卷积层;第2层为卷积核大小2×2的子采样层;第3层为卷积核大小4×4的卷积层;第4层为卷积核大小2×2的子采样层;第5层为卷积核大小4×4的卷积层;第6层为卷积核大小2×2的子采样层;第7层为384个神经元的全连接层;第8层为6个神经元的全连接层,粗分类共6大类;(3)基于Softmax分类器进行分类交通标识分类为多分类问题,类标签取多个不同的值;对于训练集{(x1 ,y1 ),(x2 ,y2 ),…,(xm ,ym )},xi 为特征图,yi ∈{1,2,…,k}为标签;在粗分类中有6大类,即限速标识、其他禁令标识、解除禁令标识、指示标识、警告标识、其它标识,在细分类中有43小类;对于给定的测试输入数据x,用假设函数hθ (x)针对每一个类别j估算出概率值p(y=j|x),函数hθ (x)形式如下: h θ ( x i ) = p ( y i = 1 | x i ; θ ) p ( y i = 2 | x i ; θ ) . . . p ( y i = k | x i ; θ ) = 1 Σ j = 1 k e θ j T x i e θ 1 T x i e θ 2 T x i . . . e θ k T x i - - - ( 3 ) ]]> 其中,θ1 ,θ2 ,…θk 是模型的参数; 是为了归一化概率分布,使得所有概率之和为1;Softmax回归算法的代价函数表示为: J ( θ ) = - 1 m [ Σ i = 1 m Σ j = 1 k 1 { y i = j } l o g e θ l T x i Σ l = 1 k e θ l T x i ] - - - ( 4 ) ]]> 其中,m为样本个数,1{·}是指示性函数,其取值规则为1{表达式值为真}=1,1{表达式值为假}=0;对于J(θ)的最小化问题,使用梯度下降法进行优化: ▿ θ j J ( θ ) = - 1 m Σ i = 1 m [ x i ( 1 { y i = j } - p ( y i = j | x i ; θ ) ) ] - - - ( 5 ) ]]> 其中, 本身是一个向量,它的第l个元素 是J(θ)对θj 的第l个分量的偏导数;每一次迭代需要进行如下更新: θ j = θ j - α ▿ θ j J ( θ ) - - - ( 6 ) ]]> 其中,α为步长;(4)细分类预处理在细分类阶段,首先对交通标识进行细分类之前的预处理,主要进行了对比度归一化、直方图均衡化和切割交通标识,然后输入到细分类阶段的快速二分卷积网络中提取特征,以提高细分类的准确率;(5)基于快速二分卷积网络进行细分类细分类过程与粗分类相似,针对处理后的图像使用快速二分卷积网络进行特征提取并采用softmax进行分类得出最终识别结果;细分类阶段使用的快速二分卷积网络,在结构上只有最后分类层的神经元数目与粗分类不同,数目为每一个粗分类对应的细分类数目,共有43个细类;粗分类和细分类两个阶段的卷积神经网络在训练阶段是独立训练的。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711373435.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种用于汽车的防盗油箱
- 下一篇:一种室温氧化甲醛纳米复合催化材料的制备方法