[发明专利]一种货车车型和轴型识别方法和系统有效
申请号: | 202010104820.0 | 申请日: | 2020-02-20 |
公开(公告)号: | CN111325146B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 张雷;姜天一;刘中华;张齐鹏 | 申请(专利权)人: | 吉林省吉通信息技术有限公司;北京邦视科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 长春科宇专利代理有限责任公司 22001 | 代理人: | 马宝来 |
地址: | 130000 吉林省*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 货车 车型 识别 方法 系统 | ||
1.一种货车车型和轴型识别方法,其特征在于,所述方法包括以下步骤:
S1采集原始车辆侧面和正面图像或视频,原始侧面和正面图像或视频包括高速公路入口抓拍图像、专用监控系统采集的视频文件;
S2检测定位车辆位置后,输入训练的深度学习模型进行货车车轴的定位和识别;
S3根据判别模型自动判别出目标图像是车辆侧面图像还是车辆正面图像,根据车辆侧面图像检测的车辆轴数和位置计算车辆的轴数、轴距和轮胎数;
利用CNN卷积神经网络训练模型对车辆的轮胎位置进行定位,卷积神经网络训练阶段输入层输入训练的标注样本,输入数据包含:图像数据,标注的ROI目标框以及所属类别的标签,检测阶段输入层输入数据是图像数据;
S4根据判别模型自动判别出目标图像是车辆侧面图像还是车辆正面图像,根据车辆正面图像进行车型识别和分类;
利用CNN卷积神经网络训练模型对车辆正面图像进行车型识别和分类,卷积神经网络训练阶段输入层输入训练的标注样本,输入数据包含:标注的图像数据以及所属类别的标签,检测阶段输入层输入数据是图像数据;
CNN卷积神经网络训练模型结构:a)卷积神经网络基础网络结构由卷积层、BN层和激活层组成卷积层单元,两个卷积层单元和残差层组成一个基础网络结构单元,可以有几十个基础单元甚至几百个基础单元构成,或是选择通用网络结构ResNet-152,基础网络结构单元的卷积核数量是32和64,或64和128,或128和256,核大小为1*1和3*3,各卷积层卷积核的大小由公式来决定:
其中,n是图像尺寸,p是扩充尺寸,f是卷积核尺寸,s是移动步长;
b)在基础网络的最后倒数三层分别接入5层1*1和3*3卷积核组成的卷积层单元;倒数第一层接入5层1*1和3*3卷积核组成的卷积层后在输出层之前接入一个卷积层单元;倒数第二层通过合并层接入倒数第一层的5层卷积层单元,同时接入5层1*1和3*3卷积核组成的卷积层后在输出层之前接入一个卷积层单元;同样,倒数第三层通过合并层接入第二层的5层卷积层单元,同时接入5层1*1和3*3卷积核组成的卷积层后在输出层之前接入一个卷积层单元;
c)采用2个尺度30*30,60*60对不同尺寸目标进行检测,越精细的网格可以检测出越精细的物体;根据样本数据统计出目标的常见尺寸作为类目标框box,每个框有x,y,w,h,confidence五个基本参数,然后还要有3个类别的输出概率,3个类别指的是常见货车有轮胎组有三种,这样每个box输出共有3*(5+3)=24个参数;
卷积神经网络的训练过程如下:使用采集到的高清车辆图像并进行标注后的图像数据进行监督学习,标注的图像数据包含车辆轮轴的坐标位置和种类,通过迭代将误差按照梯度降低算法来调整每一层的卷积核的权值,使得每一层的卷积参数可以识别轮胎类型,定位轮胎区域的目的;
步骤S4包括以下步骤:
d1)从车辆正面图像中定位车辆整体位置作为模型的整体图像输入;
d2)在车辆整体图像上按照部件提取模型提取部件的位置;
d3)组合车辆整体图像和部件图像的特征进行分类和识别。
2.如权利要求1所述的方法,其特征在于,所述步骤d2)中部件提取模型方法包括以下步骤:
d21)利用车辆定位模型对目标提取目标候选框,这些目标框包含有用的目标信息并且可以定位正确的目标位置;
d22)目标候选框包含多种类型的目标框,由覆盖整个目标的整体框,覆盖目标中心的区域的中心目标框以及固定数量的覆盖部分目标的包围框;
d23)目标候选框的选择通过打分机制来实现,目标框的得分有目标检测模型输出的分类值减去外观相似性和不同部分之间的空间重叠给出,空间重叠计算通过两个目标框的IoU给出,外观相似性有每个目标框通过目标检测模型输出的分类值计算L2距离来给出。
3.如权利要求1所述的方法,其特征在于,所述步骤d3)包括以下步骤:
d31)CNN识别模型的输入包含整理图像和部件图像;
d32)CNN识别模型可以是通用的预训练模型,resnet52或inception-v3,之后建立一个两层的堆叠LSTM融合提取后的特征,最后图像分类的损失函数定义为
。
4.一种货车车型和轴型识别方法的系统,其特征在于,系统包括原始视频获取模块,区分正面和侧面图像模块,轮胎定位模块和车辆正面前脸车型识别模块,用于实现权利要求1-3任意一项所述的一种货车车型和轴型识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林省吉通信息技术有限公司;北京邦视科技有限公司,未经吉林省吉通信息技术有限公司;北京邦视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010104820.0/1.html,转载请声明来源钻瓜专利网。