[发明专利]手写体汉字倾斜矫正方法及装置有效
申请号: | 201110163213.2 | 申请日: | 2011-06-17 |
公开(公告)号: | CN102831418A | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | 邹明福 | 申请(专利权)人: | 汉王科技股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手写体 汉字 倾斜 矫正 方法 装置 | ||
技术领域
本发明涉及文字识别领域,特别涉及一种手写体汉字倾斜矫正方法及装置。
背景技术
在汉字识别系统中,从输入端获取的数据通常带有很大的随机噪声,需要在正式识别之前对该数据进行预处理。在这些随机噪声中,有一种就是汉字字符的书写倾斜,这种倾斜的随机性必然会对识别造成影响。因此,有必要在识别前的预处理过程中增加倾斜矫正的步骤,使得用端正书写样本训练所得的识别库能够识别各种情况下的斜体字或书写不端正的汉字。
在现有的手写体汉字倾斜矫正技术中,有一种方法是采用笔段方向信息进行的联机汉字的倾斜矫正,但是这种方法对横竖笔画较多的汉字有效果,对于横竖笔画部缺少的汉字却是无能为力,存在明显的误矫和漏矫的问题。
发明内容
本发明所要解决的技术问题是针对现有技术中对多样性的倾斜手写体汉字存在误矫和漏矫的缺陷,提出一种手写体汉字倾斜矫正方法及装置,为进一步的手写识别提供更为准确的信息。
为了解决上述技术问题,本发明提供了一种手写体汉字倾斜矫正方法,包括:
获取步骤,获取手写体汉字的方向直方图以及对手写体汉字进行倾斜矫正的定点;
匹配步骤,将手写体汉字的方向直方图与样本库中多个方向直方图模版进行匹配,得到旋转角度;
矫正步骤,根据确定的倾斜矫正的定点和旋转角度,对手写体汉字进行倾斜矫正。
进一步的,该方法还可以包括:样本库建立步骤,所述样本库建立步骤包括:
分别获取每个汉字的多个样本的方向直方图,并对各方向直方图取均值,得到该汉字的均值方向直方图;将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版,将所述各方向直方图模版组成样本库。
进一步的,所述获取步骤包括:
按照一定的时间间隔,对手写体汉字进行采样,得到连续的采样点;
将每两个连续的采样点进行连线,获得该连线的角度,并获得具有相同角度的连线个数;
根据具有相同角度的连线个数和连线的角度经量化形成的角度级别的对应关系,得到手写体汉字的方向直方图;
以及,确定所述手写体汉字的书写起笔点为倾斜矫正的定点。
进一步的,所述匹配步骤包括:
针对手写体汉字的每一个角度级别,分别计算手写体汉字的方向直方图中该角度级别对应的连线个数与样本库中每一个方向直方图模版中该角度级别对应的连线个数的差值;
比较得到差值的最小值,该差值的最小值对应的角度级别即为旋转角度的级别,从而得到旋转角度。
进一步的,所述矫正步骤具体为:以倾斜矫正的定点为旋转起点,按照旋转角度对手写体汉字进行旋转。
进一步的,所述将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版具体为:
采用基于均值距离的分级聚类方法将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版,其中采用均值距离作为两个类之间的相似性度量。
本发明提供了一种手写体汉字倾斜矫正装置,包括:
获取模块,用于获取手写体汉字的方向直方图以及对手写体汉字进行倾斜矫正的定点;
匹配模块,用于将手写体汉字的方向直方图与样本库中多个方向直方图模版进行匹配,得到旋转角度;
矫正模块,用于根据确定的倾斜矫正的定点和旋转角度,对手写体汉字进行倾斜矫正。
进一步的,该装置还可以包括:样本库建立模块;所述样本库建立模块包括:
直方图获取单元,用于分别获取每个汉字的多个样本的方向直方图,并对各方向直方图取均值,得到该汉字的均值方向直方图;
聚类单元,用于将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版,将所述各方向直方图模版组成样本库。
进一步的,所述获取模块包括:
采样单元,用于按照一定的时间间隔,对手写体汉字进行采样,得到连续的采样点;
连线单元,用于将每两个连续的采样点进行连线,获得该连线的角度,并获得具有相同角度的连线个数;
获取单元,用于根据具有相同角度的连线个数和连线的角度经量化形成的角度级别的对应关系,得到手写体汉字的方向直方图,以及
定点确定单元,用于确定所述手写体汉字的书写起笔点为倾斜矫正的定点。
进一步的,所述匹配模块包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉王科技股份有限公司,未经汉王科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110163213.2/2.html,转载请声明来源钻瓜专利网。