[发明专利]基于最小错误率贝叶斯分类器的车牌数字及字母识别方法有效

专利信息
申请号: 201110120361.6 申请日: 2011-05-09
公开(公告)号: CN102184412A 公开(公告)日: 2011-09-14
发明(设计)人: 路小波;朱周;杨军飞 申请(专利权)人: 东南大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 南京天翼专利代理有限责任公司 32112 代理人: 汤志武
地址: 210096*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种基于最小错误率贝叶斯分类器的车牌数字及字母识别方法,该方法为:以粗网格特征作为字符识别的特征,针对34类数字及字母字符,建立各自的字符样本库,根据样本库计算各类字符粗网格特征的均值、协方差矩阵及字符的先验概率,进而得到各类字符的判别函数,完成最小错误率贝叶斯分类器的设计,之后提取待识别字符图像的粗网格特征,利用最小错误率贝叶斯分类器对该字符图像进行第一级分类,如果第一级分类得到的类别属于相近字符的类别,则分5种情况分别提取该字符图像不同位置的局部特征,进行相近字符的第二次分类。本发明中最小错误率贝叶斯分类器所用的判别函数简单且对字符进行二级分类,具有识别速度快、识别准确性高的优点。
搜索关键词: 基于 最小 错误率 贝叶斯 分类 车牌 数字 字母 识别 方法
【主权项】:
1.一种基于最小错误率贝叶斯分类器的车牌数字及字母识别方法,其特征在于:步骤1建立各类别字符的识别样本库根据中华人民共和国机动车号牌标准(GA36-2007),车牌中用到所有的数字字符及除I和O之外的所有字母字符,总共34类字符,针对第j类字符Lj建立样本数量为Nj的字符样本库Sj,得到样本总数量为N的总样本库S,S={Sj},j=1,2,...34,Sj={Wjk},k=1,2,...NjN=Σj=134Nj,]]>式中,Wjk是大小被归一化为80×40像素的二值化字符图像,表示第j类字符的样本库Sj中第k个样本,字符样本库S1~S10按顺序对应于数字0~9,字符样本库S11~S18按顺序对应于字母A~H,字符样本库S19~S23按顺序对应于字母J~N,字符样本库S24~S34按顺序对应于字母P~Z,步骤2最小错误率贝叶斯分类器的设计步骤2.1:对第j类字符而言,计算其字符样本库Sj中所有样本Wjk的粗网格特征FWjk(i1)=Σx1=(m1-1)×10+1m1×10Σy1=(n1-1)×10+1n1×10Wjk(x1,y1),]]>i1=1,2,...32,其中,m1=i1-n14+1,]]>是粗网格特征的第i1个分量,m1和n1分别是所对应的块的横、纵坐标,Wjk(x1,y1)是字符图像Wjk中坐标为(x1,y1)的像素的值,若为1则表示该像素属于字符,若为0则表示该像素属于背景,mod(i1,4)为i1除以4之后的余数,步骤2.2:计算字符样本库Sj中所有样本Wjk的粗网格特征均值Fj(i1)=Σk=1NjFWjk(i1)Nj,]]>i1=1,2,...32,式中,是第j类字符Lj的粗网格特征均值的第i1个分量,是字符样本库Sj中第k个样本Wjk的粗网格特征的第i1个分量,步骤2.3:计算字符样本库Sj中所有样本的粗网格特征的协方差矩阵CjCjab=1Nj-1Σk=1Nj(FWjk(a)-Fj(a))(FWjk(b)-Fj(b)),]]>a,b=1,2,...32,式中,是协方差矩阵Cj中行、列坐标分别为a、b的元素的数值,是字符样本库Sj中第k个样本Wjk的粗网格特征的第a个分量,是字符样本库Sj中第k个样本Wjk的粗网格特征的第b个分量,步骤2.4:计算在总样本库中第j类字符Lj的先验概率PjPj=NjN,]]>j=1,2,...34,步骤2.5:定义与第j类字符Lj相对应的判别函数Hj(W),得到最小错误率贝叶斯分类器H(W),H(W)={Hj(W)},j=1,2,...34,Hj(W)=-12(FW-Fj)TCj-1(FW-Fj)+lnP(j)-12jln|Cj|,]]>式中,W是任意的大小被归一化为80×40像素的二值字符图像,FW是二值字符图像W的粗网格特征,Cj-1是协方差矩阵Cj的逆矩阵,|Cj|是协方差矩阵Cj的行列式,步骤3基于最小错误率贝叶斯分类器的第一级分类步骤3.1:对需要进行识别的大小被归一化为80×40像素的二值字符图像W而言,计算其粗网格特征FWFW(i2)=Σx2=(m2-1)×10+1m2×10Σy2=(n2-1)×10+1n2×10W(x2,y2),]]>i2=1,2,...32,其中,m2=i2-n24+1,]]>Fw(i2)是粗网格特征Fw的第i2个分量,m2和n2分别是Fw(i2)所对应的块的横、纵坐标,W(x2,y2)是字符图像W中坐标为(x2,y2)的像素的值,若为1则表示该像素属于字符,若为0则表示该像素属于背景,mod(i2,4)为i2除以4之后的余数,步骤3.2:计算最小错误率贝叶斯分类器H(W)中所有判别函数Hj(W)的值,取最大的判别函数值HM(W)所对应的字符类别作为该二值字符图像W的类别,HM(W)=max(Hj(W)),j=1,2,...34,数值M与34种字符类别的对应关系为:M分别为1~10时按顺序对应于数字0~9,M分别为11~18时按顺序对应于字母A~H,M分别为19~23时按顺序对应于字母J~N,M分别为24~34时按顺序对应于字母P~Z,如果与数值M所对应的字符类别是集合{D,0,Q,8,B,2,Z,5,S,4,A}中的一种,则表明第一级分类得到的字符类别属于相似字符,可能存在一定的错误,转到步骤4进行第二级分类,否则表明第一级分类得到的字符类别不属于相似字符,以之作为该字符的最终分类结果,结束分类,步骤4相似字符的第二级分类以第一级分类结果为基础,对易混淆的5组字符提取局部特征进行第二级分类,(1)“D”、“0”和“Q”如果第一级分类得到的字符类别为“D”、“0”和“Q”,则计算字符图像W的局部特征T1和T2T1=Σx=6080Σy=2030W(x,y),]]>T2=Σx=112Σy=28W(x,y)+Σx=7380Σy=28W(x,y),]]>利用局部特征T1和T2对字符图像W进行第二级分类:如果T1≥195,则识别字符图像W为字母“Q”,如果T1<195且T2<73则识别字符图像W为数字“0”,如果T1<195且T2≥73则识别字符图像W为字母“D”,(2)“8”和“B”如果第一级分类得到的字符类别为“8”和“B”,则计算字符图像W的局部特征T3、T4和T5T3=Σx=7580Σy=28W(x,y),]]>T4=Σx=15Σy=28W(x,y),]]>T5=Σx=3842Σy=15W(x,y),]]>利用局部特征T3、T4和T5对字符图像W进行第二级分类:如果T3<24、T4<20且T5<20,则识别字符图像W为数字“8”,否则识别字符图像W为字母“B”,(3)“2”和“Z”如果第一级分类得到的字符类别为“2”和“Z”,则计算字符图像W的局部特征T6和T7T6=Σx=18Σy=140W(x,y),]]>T7=Σx=1525Σy=110W(x,y),]]>利用局部特征T6和T7对字符图像W进行第二级分类:如果T6≤260且T7≥15,则识别字符图像W为数字“2”,否则识别字符图像W为字母“Z”,(4)“5”和“S”如果第一级分类得到的字符类别为“5”和“S”,则计算字符图像W的局部特征T8和T9T8=Σx=110Σy=140W(x,y),]]>T9=Σx=140Σy=110W(x,y),]]>利用局部特征T8和T9对字符图像W进行第二级分类:如果T7≥290且T9≥270,则识别字符图像W为数字“5”,否则识别字符图像W为字母“S”,(5)“4”和“A”如果第一级分类得到的字符类别为“4”和“A”,则计算字符图像W的局部特征T10T10=Σx=7080Σy=115W(x,y),]]>利用局部特征T10对字符图像W进行第二级分类:如果T10<180,则识别字符图像W为数字“4”,否则识别字符图像W为字母“A”。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201110120361.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top