[发明专利]一种用于手写汉字识别的图像特征提取方法无效
申请号: | 200810220334.4 | 申请日: | 2008-12-24 |
公开(公告)号: | CN101488182A | 公开(公告)日: | 2009-07-22 |
发明(设计)人: | 金连文;张志毅;丁凯 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46 |
代理公司: | 广州粤高专利代理有限公司 | 代理人: | 何淑珍 |
地址: | 510640广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 手写 汉字 识别 图像 特征 提取 方法 | ||
技术领域
本发明属于模式识别与人工智能技术领域,特别是涉及一种手写汉字图像识别处理方法。
技术背景
一个手写汉字识别系统分为预处理、特征提取、分类识别和后处理四个模块,其中特征提取被认为是汉字识别中一个关键的步骤之一,对整个系统的最终性能有着重要的影响。近年来,很多学者在如何获取有效的特征方面做了很多研究工作,取得了很多优秀的成果。Gabor特征是各种汉字特征中的一种较为有效的特征,它应用的背后有着很好的生物视觉理论支持。事实上,模式识别与计算机视觉和生物视觉理论在一直以来都有着紧密的联系。
随着计算机视觉与生物视觉理论的发展,最近有越来越多先进的图像特征提取算法被提出。其中,David G.Lowe2004年发表在International Journal ofComputer Vision的论文“Distinctive Image Features from Scale-InvariantKeypoints”提出的尺度不变性特征变换算法(Scale Invariant FeatureTransform,简称SIFT)被认为是最有代表性的特征提取算法之一,受到了计算机视觉领域广泛的关注。SIFT整套算法包括定位特征点与对特征区域提取特征向量两部分,提取出来的特征向量一般被称为SIFT描述子(SIFTdescriptor)。SIFT特征已经被广泛应用于图像配准、图像检测、目标识别等领域,并且有着出色的表现。但是,在汉字识别领域,特别是手写汉字识别领域,SIFT特征却无法成功的应用,这是因为自由书写汉字由于个人风格的差异,即使是同一个字的图形也有很大差别,同时还有加上笔画形变,噪声点等问题让这种差异性变得更大。因此,SIFT特征点定位方法对脱机手写汉字识别是不适合的,需要寻找更合适的特征定位策略。
发明内容
本发明的目的是为了克服直接应用SIFT特征点定位无法提取有效的适应不同书写风格的尺度不变特征的问题,结合手写汉字图像的特点,应用弹性网格技术与SIFT特征,设计出基于二次局部弹性区域的SIFT特征的手写汉字特征提取方法。
为了实现发明目的,本发明采用的技术方案为:一种用于手写汉字识别的图像特征提取方法,将手写汉字图像切分成一系列稳定的特征提取区域,再通过尺度不变性特征变换算法对这些区域进行特征提取。
具体包括如下几个主要步骤:
(1)、先水平后垂直弹性切分手写汉字图像成局部子图像块;
(2)、对子图像块提取SIFT描述子特征;
(3)、先垂直后水平再次切分手写汉字图像成局部图像块,重复(2);
(4)、拼接所有局部图像块SIFT特征形成最终特征向量。
所述步骤(1)弹性切分脱机手写汉字图像成子图像块的过程是:通过先对汉字图像在水平方向上非均匀弹性划分3个长方形,划分的原则是让每个长方形内具有相等的汉字像素,然后在垂直方向上在各个长方形图块内部进行非均匀弹性切分,使得每个长方形图块均切分出3个彼此间汉字像素相等的小长方形图块,最终得到9块子图像块。
所述步骤(2)通过对图像块提取SIFT描述子特征过程是:通过先将切分出的图块大小进行线性归一化,然后对每块图块区域提取SIFT描述子特征,提取中使用的SIFT描述子参数为:切分区域数目为2×2、统计方向为8,于是每块图块获得的特征向量维数为32。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810220334.4/2.html,转载请声明来源钻瓜专利网。