[发明专利]一种基于卡口图像的车辆定位及型号识别方法在审
申请号: | 201610900576.2 | 申请日: | 2016-10-15 |
公开(公告)号: | CN107085696A | 公开(公告)日: | 2017-08-22 |
发明(设计)人: | 朱文佳;陶诗德;骆乐乐;申建飞;刘莉 | 申请(专利权)人: | 安徽百诚慧通科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06K9/66;G06N3/08 |
代理公司: | 合肥天明专利事务所(普通合伙)34115 | 代理人: | 金凯 |
地址: | 230088 安徽省合肥市高*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卡口 图像 车辆 定位 型号 识别 方法 | ||
技术领域
本发明涉及计算机视觉目标识别技术领域,具体是一种基于卡口图像的车辆定位及型号识别方法,可用于智能交通领域
背景技术
智能交通是未来交通系统的发展方向,它提高了运输效率,缓解了交通拥挤,保障了交通安全,降低了能源消耗和环境污染。车型识别作为智能交通系统中的重要分支,在车流量检测、交通状态监控、红灯违法追踪和判案刑侦方面等具有非常广泛的应用前景。
目前的车型和车辆型号识别方法主要有:电磁感应线圈检测法、雷达识别法、红外线识别法、车牌识别法和基于视频图像的识别方法。在前述的几种车型识别方法中,电磁感应线圈检测法、雷达识别法、红外线识别法和车牌识别法国内研究比较多,且大多已有成熟的应用,但这些方法需要增加相应的硬件设备,如地感线圈、雷达等,且只能检测大车、小车或车牌、车牌颜色等基本参数,检测结果精度较低,不能对车辆的型号进行识别。随着近些年计算机视觉技术的发展,由于其使用成本低,能获得更加详细的信息等特点,利用计算机视觉技术对车型及车辆型号进行识别的方法也慢慢被人们所提出来。
由于车辆型号数目、不同型号的车辆间存在相似度较大的情况,又高速公路场景复杂,卡口相机的拍摄质量不一,这些都对基于卡口图像的车辆定位和型号识别带来了很大的难题,许多现有的技术都只能针对特定的场景取得较好的效果,故如何设计一个鲁棒性高,准确率高的方法来对卡口图像中的车辆型号进行识别依然是一个值得挑战的课题。
发明内容
本发明的目的是针对现有的车辆型号识别方法的不足,提出一种基于卡口图像的车辆定位及型号识别方法,利用卷积神经网络在目标检测方面的应用,以解决卡口图像中车辆的定位于识别问题。
为了达到上述目的,本发明所采用的技术方案为:
一种基于卡口图像的车辆定位及型号识别方法,利用卡口图像样本集,训练可检测车辆型号的卷积神经网络,对卡口系统拍摄的图像中的车辆的定位及型号进行识别,包括以下步骤:
(1)样本采集及标注:从高速公路卡口系统中采集车辆的源图像,标注出源图像中包含的每一辆车辆的位置及型号,将源图像和标注信息作为卷积神经网络的训练样本集;
(2)卷积神经网络的设计:设计用于定位识别车辆的卷积神经网络,将源图像和标注信息输入网络的输入层,网络的中间层采用卷积层和全连接层提取特征,网络的输出层利用提取到的特征通过两个输出分支分别得到图片中车辆的包围盒和类型;
(3)卷积神经网络的训练:使用源图像和标注信息对卷积神经网络的参数进行迭代训练,使其具备定位和识别车辆类型的功能;
(4)车辆定位及型号识别:根据训练好的卷积神经网络,对卡口系统拍摄的图像中车辆所在位置进行定位,并判断其所属的型号。
优选地,所述步骤(1)中,样本的收集及标注过程如下:
(1)大数据的样本采集:根据现阶段公路上行驶车辆的型号,按照每种型号至少100张样本源图像的要求,在从不同地域、不同路况的高速公路的卡口系统中采集不同时间段的源图像样本;
(2)大数据的样本标注:根据卡口自动获取的车牌号,利用车管所的数据库获取车辆的型号;通过人工框选的方法得到源图像中车辆位置的左上角和右下角坐标,将同一张源图像中的所包含的所有车辆位置和类别信息都记录在一个XML文档中;对每一张车辆源图像使用selective search分割,产生的分割快的坐标全部保存在一个ss.mat中。
优选地,所述步骤(2)中,卷积神经网络的设计过程如下:
(1)卷积神经网络的输入层为整个网络输入数据:训练阶段输入的数据包括图像数据,感兴趣区域包围盒,标定的目标包围盒及其所属类别的标签;检测阶段的输入层输入的数据包括图像数据和感兴趣区域包围盒;
(2)卷积神经网络的中间层为提取特征的卷积层和全连接层,网络的结构为八层网络结构,第一层和第二层分别是96个核大小为11*11和256个核大小为5*5的卷积层,每一层的后面设有一个用于降维的池化层;第三层、第四层、第五层是核大小为3*3的卷积层,卷积核数量分别是384、384和256个,其中第五层卷积层后设有一个ROI池化层,该ROI池化层用以实现前面的卷积层在整张图片上的操作,并将卷积的结果映射到各个感兴趣区域,同时产生一个固定大小的输出作为全连接层一、全连接层二的输入;
(3)卷积神经网络的最后分支结构的全连接层组合:
首先是全连接层一、全连接层二将所述ROI池化层的输出作为输入,产生一个4096为的特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽百诚慧通科技有限公司,未经安徽百诚慧通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610900576.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:干扰消除方法、装置、存储介质及终端
- 下一篇:一种监听信标帧的方法及终端
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序