[发明专利]一种基于YOLOv3网络的车牌检测方法在审
申请号: | 202010002151.6 | 申请日: | 2020-01-02 |
公开(公告)号: | CN111178451A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 屈景怡;冯晓赛;杨俊 | 申请(专利权)人: | 中国民航大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/32;G06N3/04 |
代理公司: | 天津企兴智财知识产权代理有限公司 12226 | 代理人: | 苏冲 |
地址: | 300300 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 yolov3 网络 车牌 检测 方法 | ||
1.一种基于YOLOv3网络的车牌检测方法,其特征在于:包括如下步骤:
数据预处理:搜集包含车牌的图片,分类整理;通过数据均衡的方法扩大较少的新能源车牌数量、使馆领馆车牌数量和民航车牌数量,使之与蓝色车牌数量相当,将上述图片标记为数据集;
特征提取:将数据预处理中得到的数据集编码后输入到Darknet-53网络,取最后两层残差层的输出作为特征矩阵;
分类预测:将特征提取中得到的两个不同维度的特征矩阵,拼接后送入逻辑回归分类器,输出车牌的位置和种类。
2.根据权利要求1所述的一种基于YOLOv3网络的车牌检测方法,其特征在于:所述数据均衡的方法为:通过扭曲、旋转、加入随机噪声的方法,扩充图片样本数量。
3.根据权利要求1所述的一种基于YOLOv3网络的车牌检测方法,其特征在于:Darknet-53网络由一系列的1×1和3×3的卷积层组成,每个卷积层后都会跟一个BN层和一个LeakyReLU层。
4.根据权利要求1所述的一种基于YOLOv3网络的车牌检测方法,其特征在于:所述特征提取中Darknet-53网络包括激活函数、卷积层、快捷链路层、路由层、上采样层和YOLO层,YOLO层包括了锚盒参数、目标类别和预选框个数。
5.根据权利要求4所述的一种基于YOLOv3网络的车牌检测方法,其特征在于:所述YOLOv3用锚盒参数选取目标候选框的步骤为:YOLOv3将输入图像分成s×s的网格,每个网格根据锚盒参数及特征图多尺度缩放预测出n个候选框的位置及候选框内疑似目标对应的目标种类置信度,由锚盒参数获得目标候选框位置的方法如下式所示:
上式中,cx,cy表示网格位置,锚盒中心为网格中心,bh,bw表示目标候选框相对锚盒的长宽偏移量,bx,by表示中心偏移量,σ为逻辑回归函数,
6.根据权利要求1所述的一种基于YOLOv3网络的车牌检测方法,其特征在于:分类预测的具体方法为:特征提取中DarkNet-53网络最后两个残差层的输出,经过采样和张量拼接后,得到两个大小不同的特征图,在两个不同大小的尺度上预测不同大小的车牌目标,每个尺度中,需要预测出x、y、w、h、p这五个参数,其中x、y、w、h对应数据集标签中的车牌目标边界框的左上角横坐标、左上角纵坐标、宽度、高度,p表示车牌目标对应种类的类别及置信度,
7.根据权利要求6所述的一种基于YOLOv3网络的车牌检测方法,其特征在于:在分类预测中使用逻辑回归分类器的方法为,YOLOv3主要通过三个损失函数实现由特征图到输出参数的逻辑回归:目标定位偏移量损失Lloc(l,g),用来确定车牌目标的位置;目标置信度损失Lconf(o,c),用来确定车牌目标属于不同车牌种类的概率;目标分类损失Lcla(O,C),用来表示车牌目标所属车牌的种类,其中λ1,λ2,λ3是平衡系数:
L(O,o,C,c,l,g)=λ1Lloc(l,g)+λ2Lconf(o,c)+λ3Lcla(O,C)
目标置信度损失:目标置信度表示目标矩形框内存在目标的概率,目标置信度损失采用的是二值交叉熵损失,其中,oi∈{0,1}表示预测目标边界框i中是否真实存在目标,0表示不存在,1表示存在;表示预测目标矩形框i内是否存在目标的Sigmoid概率,将预测值ci通过sigmoid函数得到:
目标类别损失:目标类别损失Lcla(O,C)同样采用的是二值交叉熵损失,其中,Oij∈{0,1},表示预测目标边界框i中是否真实存在第j类目标,0表示不存在,1表示存在;表示网络预测目标边界框i内存在第j类目标的Sigmoid概率,由预测值Cij通过sigmoid函数得到:
目标定位损失:目标定位损失Lloc(l,g)采用的是真实偏差值与预测偏差值差的平方和,其中表示预测矩形框坐标偏移量,这里网络预测的是偏移量,不是直接预测坐标,表示与之匹配的预选框与默认框之间的坐标偏移量,中上标m∈{x,y,w,h},bx、by、bw、bh分别为预测的目标矩形框的左上角横坐标、左上角纵坐标、边界框的宽、边界框的高,cx、cy、pw、ph分别为默认预选框的左上角横坐标、左上角纵坐标、边界框的宽、边界框的高,gx、gy、gw、gh分别为与默认预选框匹配的真实目标矩形框的左上角横坐标、左上角纵坐标、边界框的宽、边界框的高,这些参数都是映射在预测特征图上的,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航大学,未经中国民航大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010002151.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:可卷绕的显示装置及其控制方法
- 下一篇:X光图像局部对比度增强方法及终端