[发明专利]基于模糊熵的Congealing方法构造汉字字符及识别的方法有效
申请号: | 201410431198.9 | 申请日: | 2014-08-28 |
公开(公告)号: | CN104182773B | 公开(公告)日: | 2017-06-06 |
发明(设计)人: | 李映;李方轶 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06K9/68 | 分类号: | G06K9/68 |
代理公司: | 西北工业大学专利中心61204 | 代理人: | 王鲜凯 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模糊 congealing 方法 构造 汉字 字符 识别 | ||
技术领域
本发明属于计算机图像处理,涉及一种构造汉字字符及识别的方法,尤其涉及一种基于模糊熵的Congealing方法构造汉字字符及识别的方法。
背景技术
手写汉字识别方法在机器学习和人工智能领域被广泛研究着。目前,手写汉字识别方法被分为在线识别和离线识别。其中,离线识别方法研究的对象是分离的、孤立的手写汉字图像,利用机器学习的技术通过训练和分类过程,将待识别的手写汉字字符分类到正确的类别中。
由于汉字字符的巨大数量,多样的汉字结构,以及各异的手写风格,使得手写汉字识别十分困难。目前的手写汉字识别系统主要采用特征提取技术,然而特征提取的过程会受到人为主观因素的影响,导致提取到的特征不能很好地表示该字符。因此成为基于特征提取方法的手写汉字识别方法的一个缺点。
文献“Learned-Miller,Erik G."Data driven image models through continuous joint alignment."Journal IEEE Transactions on Pattern Analysis and Machine Intelligence 28.2(2006):236-250”中公开了一种图像校正技术——Congealing算法,该算法的目标是校正一组同类图像,减小该类图像间的差异,使之趋于相同。被校正的图像可以作为分类的模型用于识别过程。这是一个完全数据驱动的算法过程,避免了特征提取可能存在的缺点。
文献“Mac Parthalain,Neil,and Harry Strange."Fuzzy-entropy based image congealing."Fuzzy Systems(FUZZ),2013IEEE International Conference on”中提出一种基于模糊熵的Congealing算法,这是对原Congealing算法的一种改进,用模糊熵代替信息熵,作为目标函数,被证明能够获得更好的校正结果。
发明内容
要解决的技术问题
为了避免现有技术的不足之处,本发明提出一种基于模糊熵的Congealing方法构造汉字字符及识别的方法,克服由于特征提取造成的对手写汉字字符不能很好地表示的问题。
技术方案
一种基于模糊熵的Congealing方法构造汉字字符的方法,其特征在于:随机选取某个字符类中的N张图像作为训练样本,训练步骤如下:
步骤1:对N张训练字符图像分别初始化变换参数向量
vj=(tx,ty,θ,sx,sy,hx,hy)=0,j∈[1,N],其中tx表示x方向的平移变换,ty表示y方向的平移变换,θ表示旋转变换,sx表示x方向的尺度变换,sy表示y方向的尺度变换,hx表示x方向的剪切变换,hy表示y方向的剪切变换。
然后计算出相应的变换矩阵Uj:
步骤2:计算N张训练字符图像样本的模糊熵,步骤如下:
1)图像栈IS中N张图像,每张有M个像素,表示图像栈中一个像素的值,xi表示一个像素栈图像栈中的每一张图像I∈IS被变换矩阵独立的改变,Uj表示第j个变换矩阵,xj′表示变换后的像素栈,i∈[1,M],j∈[1,N];
2)利用模糊相似性关系,得到关于像素栈xi的关系矩阵M(R):
3)由关系矩阵M(R)可得到像素栈xi的模糊熵为H(xi)
其中:
4)训练字符图像的模糊熵为一个字符训练样本中的所有像素栈的模糊熵的和:
步骤3:进行如下迭代过程,直至模糊熵收敛或迭代达到上限K为止:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410431198.9/2.html,转载请声明来源钻瓜专利网。