[发明专利]电力电能表图像自动识别方法有效
申请号: | 201010150835.7 | 申请日: | 2010-04-20 |
公开(公告)号: | CN102236788A | 公开(公告)日: | 2011-11-09 |
发明(设计)人: | 付永全 | 申请(专利权)人: | 荣科科技股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/38 |
代理公司: | 沈阳利泰专利商标代理有限公司 21209 | 代理人: | 王东煜 |
地址: | 110002 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电力 电能表 图像 自动识别 方法 | ||
1.电力电能表图像自动识别方法,其特征在于包括以下步骤:
步骤一图像预处理,采用sobel算子检测表盘图像的垂直纹理,并且采用投影法初步去除背景区域;再采用膨胀算法提取垂直纹理丰富的区域;最后采用基于积分投影法的自适应阈值分割方法对图像进行二值化处理;
步骤二示值与条码的精确定位:
(1)、示值的精确定位,基于sobel算子的垂直边缘检测及形态学处理的基础上,结合了复杂图像背景下基于示值间距和数字字符的长宽比特征的智能判断方法,适应不同类型电能表的示值精确定位,同时,突破传统单个完整字符定位方法,当示值处于半字符状态时能够判断该位置是否为上下两个不完整字符情况,并且根据上下半字符的比例关系选取特征信息较多的字符读数作为该位置的读数;
(2)、条码精确定位,根据条码区域垂直纹理较多的特征在传统投影定位方法基础上融合了条码区域的边缘特征,对可能是条码的区域进行水平扫描,提取满足条码特征的区域,并且根据电能表条码的编码方法判断出条码类型;
步骤三条码识别,首先采用逐行扫描的方法计算出一个条码字符连续条空的宽度,然后采用归一化理论,针对不同类型的条码用相似边距离归一化方法对字符条码进行识别;
步骤四示值识别,由于电能表种类繁多,示值的字符类型不一致,而且机械式电能表的示值会出现半字符的现象,一般的模板匹配法、统计特征法和结构特征法都是很难取得理想的识别效果,因此示值识别采用基于PCA的数字识别方法,使用PCA方法可以很容易的提取出示值的内在结构的主元,即可初步描述示值的结构信息,若有新的图像需要与原有图像比较,就可以在变换的主元维度上进行比较,则可根据新图与原有数据集的相似度识别示值的读数。
2.根据权利要求1所述的电力电能表图像自动识别方法,其特征在于:示值的精确定位的具体步骤如下:
(1)、采用水平垂直扫描法结合数字字符的宽度与长度的比一般在0.15~1.25之间的特征去除所有目标区域中宽度大于区域高度3/4或小于2个像素宽或宽度与长度的比一般小于0.15或大于1.25的伪目标;
(2)、采用像素统计法去除小面积的噪声点和面积很大的干扰背景;
(3)、根据示值间等间距的特征进一步精确提取示值区域,具体如下:
①求出区域中相邻、相隔目标的间距D1、D2,合并D1、D2并对其排序得到D,由于电能表示值一般为5位或6位,取D中连续4个以上间距之差小于5的间距,并求其均值得到Dmean;
②在D1、D2中分别取满足|D1[i]-Dmean|<8或|D2[i]-Dmean|<5的坐标i,并且映射到目标区域坐标,即记录坐标i和i+1为有效目标坐标;
③统计有效目标的高度均值Hmean,如果Hmean<10,此区域为非示值区域,返回下一个区域;
④统计有效目标个数,如果大于7个目标需要采用基于中心坐标特征进一步排除干扰目标;首先求出有效目标的中心坐标的横坐标均值Cxmean,如果有效目标的中心坐标的横坐标Cx-Cxmean>15,认为该目标位伪目标;
⑤判断示值状态,分别求出示值高度的最大值Hmax和最小值Hmin,如果Hmax-Hmin>8,认为该示值中存在半字符,且认为Hmax与示值高度H的差大于8的示值为半字符,然后分别去该示值字符的上下边界R_top、R_bottom与高度最大示值字符的上下边界Hmax_top、Hmax_bottom做差,如果Hmax_top-R_top>8该示值字符为上半字符,如果R_bottom-Hmax_bottom>8该示值字符为下半字符。
3.根据权利要求2所述的其特征在于:条码的精确定位根据条码区域垂直纹理较多的特征在传统的投影定位方法基础上融合了条码区域的边缘特征,对可能是条码的区域进行逐行扫描,统计区域内边界个数k和边界点的横坐标构成矩阵A,当k满足44≤k<60认为该条码为8码条码,否则当k≥60认为该条码为13码条码,如果k<44重新扫描下一行;
步骤三条码识别,包括基于归一化理论的条码识别:
(1)、根据条码行的坐标矩阵A求条码连续条空宽度,得到矩阵C;
(2)、采用归一化理论,用一种相似距离归一化的方法对条码进行判别;
步骤四示值识别,包括基于PCA的示值识别;
PCA是Principal component analysis的缩写,中文翻译为主元分析;它是一种对数据进行分析的技术,最重要的应用是对原有数据进行简化;正如它的名字:主元分析,这种方法可以有效的找出数据中最“主要”的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭示隐藏在复杂数据背后的简单结构;它的优点是简单,而且无参数限制,可以方便的应用与各个场合,因此应用极其广泛;
本发明中的示值识别部分采用基于PCA的数字识别方法,基于PCA的数字识别方法包括字符图像训练和识别两部分;
字符图像训练首先搜集了10类数字字符图库,每类包含70幅各种类型的数字字符二值图像,图像尺寸归一化为20×36;另外分别从上向下和从下向上截取整字符高度2/3到8/9部分的字符区域组成上下半字符图库,半字符图像归一化尺寸为20×24;然后采用PCA算法训练特征数据,以整字符训练为例,设待测试图像为X,M=36,N=20,m=10×70=700,n=M×N=720,训练过程具体步骤如下:
1、计算平均图像Mu=sum(Xi)/m;i=1,...,m;
2、Xi-=Mu
3、计算协方差矩阵SIGMA=sum(Xi×T(Xi))/m;i=1,...,m。SIGMA是一个n×n实对称矩阵,T(Xi)表示矩阵Xi转置;
4、计算Sigma的特征值lambda_k和特征向量Wk,k=1,...,n,lambda_1>=lambda_2>=...>=lambda_n;
5、构造n×m′大小的子空间变换矩阵W=[W1,...,Wm’];m′<=m,m′<<n,m′的大小根据需要选择,使之满足:
[sum(lambda_k,k=1,...m′)/sum(lambda_k,k=1,...,n)]>0.90
6、计算图像Xi的投影坐标:Ai=T(W)×(Xi-Mu);T(W)表示矩阵W转置,Ai是m′×1的列向量,投影坐标就是图像特征;
7、保存矩阵A、T作为特征数据;
示值识别部分具体步骤如下:
(1)、将定位得到的二值字符图像做待识别字符归一化处理,即整字符归一化为20×36的图像,半字符归一化为20×24的图像;
(2)、根据字符状态调入训练好的特征数据A、T;
(3)、对于N×M大小的待识别图像Y,计算Y的投影坐标,坐标:B=T(W)×Y;T(W)表示矩阵W转置;
(4)、计算待识别图像Y与库中图像Xi间距离:
d(Xi,Y)=sqrt(sum((B[k]-Ai[k])×(B[k]-Ai[k])))
其中,k=1,...,m′;理论上,如果d(Xj,Y)=min{d(Xi,Y)},则Y与Xj为基本同类的字符,但是在实际应用中直接取最小距离对应的类最为Y的读数往往识别率不高,因此本发明对识别部分算法进行了改进:
①将距离d分为10类,每一类中包含70个距离;
②对每一类距离进行升序排序,得到dsort;
③取dsort中前10个距离的均值记做d_min,如果d_min(i)=min{d_min)},则Y属于第i类字符,i=1,...,10。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于荣科科技股份有限公司,未经荣科科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010150835.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:施工现场的液压缸清洗油过滤回收装置
- 下一篇:反冲洗台式净水器
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序