[发明专利]一种基于复杂背景下的车牌自动定位和识别方法无效
申请号: | 201210062174.1 | 申请日: | 2012-03-09 |
公开(公告)号: | CN102708356A | 公开(公告)日: | 2012-10-03 |
发明(设计)人: | 石佳;张志佳 | 申请(专利权)人: | 沈阳工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/54;G06N3/02;G08G1/017 |
代理公司: | 沈阳智龙专利事务所(普通合伙) 21115 | 代理人: | 宋铁军 |
地址: | 110870 辽宁省沈*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 复杂 背景 车牌 自动 定位 识别 方法 | ||
1.一种基于复杂背景下的车牌自动定位和识别方法,其特征在于:图像采集是由交警或者管理人员在随机的情况下拍摄的汽车图片,采集的方式不是固定在某个位置或者路口,而是随走随拍的方式,这种采集方式具有随机性,针对这些复杂背景下采集的汽车图片进行车牌定位、字符分割和识别,该方法步骤如下:
(1)对车牌进行定位:将数码相机随机采集的车牌图像输入到计算机中,对车牌图像进行处理,包括汽车图像的倾斜校正、车体区域图像的灰度化、边缘检测、阈值分割、形态学运算,得到若干的连通区域,根据投影法搜索车牌区域,得到候选车牌区域图像,具体步骤如下:
1)由于采集到的图像可能出现偏转,需要对这部分的图像采用Radon变换对倾斜的车牌图像进行校正,先计算倾角,然后对倾斜图像利用坐标变换公式进行校正,如公式(1)和(2)所示;为了进行对牌照图像的旋转,首先选定旋转中心,以车牌照图像几何中心位置作为旋转中心来进行旋转;取角度从0到179度,每次增加1度,对汽车的二值图像作Radon变换;在所有Rθ(x′)结果中取最大值;找到与该最大值对应的角度θ;由于θ与图像的倾斜方向垂直,取逆时针为正方向,得出图像的倾斜角度为θ-90°;
2)利用公式gray=0.299R+0.587G+0.114B对车牌图像进行灰度计算;
3)为找到车牌区域,首先要加强车牌区域的边缘梯度信息,利用改进累积绝对差分算法对车牌图像的灰度信息进行垂直边缘检测,对于点(i,j)对应的灰度值为f(i,j),则该点相邻的上、中、下方向上像素点表示为(i,j-1)、(i,j)、(i,j+1)所对应的灰度值为f(i,j-1)、f(i,j)、f(i,j+1),对应算法为公式(3):
E(i,j)=|f(i,j+1)-f(i,j)-(f(i,j) (3);
-f(i,j-1))-(f(i,j+1)-f(i,j-1))|
4)得到了灰度图像的垂直边缘点,再利用归一化公式(4),将边缘灰度信息归一化:
E(i,j)=(255/(max(i,j)-min(i,j)) (4)
*(E(i,j)-mm(i,j)))
式中,max(i,j)为E(i,j)中的最大灰度级,min(i,j)是最小灰度级;
5)对归一化后的边缘图像求出边缘像素密度作为初始阈值T公式(5),然后利用公式(6)进行形态学闭运算,针对边缘图像数学形态学处理后的二值图像求阈值Average如公式(7),分割的阈值利用Average对初始阈值进行修正T-Average,由于大量实验表明车牌的边缘密度占整个图像的3%左右,因此利用公式(5)~(7)循环判断T-Average的值,当T-Average=0.03左右,循环停止,这样找到的阈值更具有通用性,可针对多种复杂情况的图片实现阈值分割;
式中,m、n是图像的行、列数,α是系数,根据汽车车牌区域的垂直边缘信息和背景信息的区别α通常取0.5,
式中,f(x,y)为对边缘图像进行形态学处理后的像素点(x,y)对应的值,得到的Average可以看成是边缘像素密度;
6)结合车牌字符的纹理特征对车牌区域进行定位,通过水平和垂直搜索黑白像素跳变的规律来判断真实的车牌区域,具体为:得到预处理后的图像对其进行自下而上和自左而右的扫描,判断扫描线与候选区域的交点个数,从而得到候选车牌区域;
(2)对步骤(1)获取的车牌图像进行处理,包括灰度化、二值化,然后对处理后的二值图像进行单个字符分割,具体步骤为:
1)按照步骤(1.2)对得到的彩色车牌区域进行灰度化;
2)利用Otsu方法对牌照区域的灰度图像进行阈值分割,如公式(8)和公式(9)求出和取比值得到分割阈值,
3)采用基于垂直投影的车牌字符分割,对于车牌二值图像f(i,j)大小为M*N,定义f(i,j)在j行上的垂直投影函数为式(10)所示,
由于字符之间存在间隔,那么垂直投影就会在间隔处存在波谷,可以利用这一信息对字符进行单个字符分割,但需要注意的是,对于一些模糊或者划痕过于严重的车牌,在预处理后会出现字符之间粘连的现象,这样会造成字符被错误分开,此时就需要用车牌字符宽度与总宽度比为10.2%这一先验知识设定阈值T1和T2,进行分割,其中W是图片的总宽度,
因为二三字符间距是整个间隙中最大最明显的,所以以此为参考点,利用该零值的边界就可以找到第二个字符的右边界和第三个字符的左边界;接着分别向左和右扫描字符,如果扫描到的字符垂直投影宽度小于阈值T1需要合并字符,如果大于阈值T2(T1<T2),则还需要进一步分割,若在这两个值之间,就不需要处理;确定需要合并的话,则继续判断该字符的左右两边字符宽度,如果左边字符宽度小于T1,则该字符与左边字符合并,如果右边字符宽度小于T1,则该字符与右边字符合并;确定需要继续分割的话,那么就是要将两边的一个字符中的部分笔画误当成了该字符,在左右两边就会需要合并,找到小于T1部分并合并,再取合并的字符重点作为分割的边界,这样会有效的避免铆钉、边框和非字符图像的影响;
(3)利用BP神经网络实现车牌字符的识别:
BP网络3个层的神经元数目的确定是BP网络设计的关键:
1)输入层个数:
BP网络的输入层的节点个数,即为归一化图像所输出的特征的维数,用8*16归一化特征提取采用的是逐像素特征提取法,这样,对于每一个输入样本,就有8*16个特征,所以输入层的结点个数为1280;
2)隐层结点个数:
对于隐层的结点个数,OCR系统的神经网络的隐层个数一般在8~30个结点之间;根据测试结果不断改变结点数目可以在上述范围内确定较好的隐层结点个数;
3)输出层结点个数:
对于输出层结点个数的确定,取决于如何设定标准输出;
神经网络一般都有一个激励函数,激励函数将输出信号压缩为一个允许的范围内,使其成为有限值,通常神经元输出的范围在(0,1)或者(-1,1)的闭区间上,常用的为Sigmoid函数,Sigmoid函数定义如公式(12):
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳工业大学,未经沈阳工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210062174.1/1.html,转载请声明来源钻瓜专利网。