[发明专利]手写体汉字倾斜矫正方法及装置有效
申请号: | 201110163213.2 | 申请日: | 2011-06-17 |
公开(公告)号: | CN102831418A | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | 邹明福 | 申请(专利权)人: | 汉王科技股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手写体 汉字 倾斜 矫正 方法 装置 | ||
1.一种手写体汉字倾斜矫正方法,其特征在于,包括:
获取步骤,获取手写体汉字的方向直方图以及对手写体汉字进行倾斜矫正的定点;
匹配步骤,将手写体汉字的方向直方图与样本库中多个方向直方图模版进行匹配,得到旋转角度;
矫正步骤,根据确定的倾斜矫正的定点和旋转角度,对手写体汉字进行倾斜矫正。
2.根据权利要求1所述的方法,其特征在于,还包括:样本库建立步骤,所述样本库建立步骤包括:
分别获取每个汉字的多个手写体样本的方向直方图,对各方向直方图取均值,得到该汉字的均值方向直方图;
将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版,将所述各方向直方图模版组成样本库。
3.根据权利要求2所述的方法,其特征在于,所述将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版具体为:
采用基于均值距离的分级聚类方法将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版,其中采用均值距离作为两个类之间的相似性度量。
4.根据权利要求1-3所述的方法,其特征在于,所述获取步骤包括:
按照一定的时间间隔,对手写体汉字进行采样,得到连续的采样点;
将每两个连续的采样点进行连线,获得该连线的角度,并获得具有相同角度的连线个数;
根据具有相同角度的连线个数和连线的角度经量化形成的角度级别的对应关系,得到手写体汉字的方向直方图;以及
确定所述手写体汉字的书写起笔点为倾斜矫正的定点。
5.根据权利要求4所述的方法,其特征在于,所述匹配步骤包括:
针对手写体汉字的每一个角度级别,分别计算手写体汉字的方向直方图中该角度级别对应的连线个数与样本库中每一个方向直方图模版中该角度级别对应的连线个数的差值;
比较得到差值的最小值,该差值的最小值对应的角度级别为旋转角度的级别,从而得到旋转角度。
6.根据权利要求5所述的方法,其特征在于,所述矫正步骤具体为:以倾斜矫正的定点为旋转起点,按照旋转角度对手写体汉字进行旋转。
7.一种手写体汉字倾斜矫正装置,其特征在于,包括:
获取模块,用于获取手写体汉字的方向直方图以及对手写体汉字进行倾斜矫正的定点;
匹配模块,用于将手写体汉字的方向直方图与样本库中多个方向直方图模版进行匹配,得到旋转角度;
矫正模块,用于根据确定的倾斜矫正的定点和旋转角度,对手写体汉字进行倾斜矫正。
8.根据权利要求7所述的装置,其特征在于,还包括:样本库建立模块;所述样本库获取模块包括:
直方图获取单元,用于分别获取每个汉字的多个样本的方向直方图,并对各方向直方图取均值,得到该汉字的均值方向直方图;
聚类单元,用于将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版,将所述各方向直方图模版组成样本库。
9.根据权利要求8所述的装置,其特征在于,所述聚类单元具体用于采用基于均值距离的分级聚类方法将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版,其中采用均值距离作为两个类之间的相似性度量。
10.根据权利要求7-9所述的装置,其特征在于,所述获取模块包括:
采样单元,用于按照一定的时间间隔,对手写体汉字进行采样,得到连续的采样点;
连线单元,用于将每两个连续的采样点进行连线,获得该连线的角度,并获得具有相同角度的连线个数;
获取单元,用于根据具有相同角度的连线个数和连线的角度经量化形成的角度级别的对应关系,得到手写体汉字的方向直方图,以及
定点确定单元,用于确定所述手写体汉字的书写起笔点为倾斜矫正的定点。
11.根据权利要求10所述的装置,其特征在于,所述匹配模块包括:
计算单元,用于针对手写体汉字的每一个角度级别,分别计算手写体汉字的方向直方图中该角度级别对应的连线个数与样本库中每一个方向直方图模版中该角度级别对应的连线个数的差值;
比较单元,用于比较得到差值的最小值,该差值的最小值对应的角度级别即为旋转角度的级别,从而得到旋转角度。
12.根据权利要求11所述的装置,其特征在于,所述矫正模块具体用于以倾斜矫正的定点为旋转起点,按照旋转角度对手写体汉字进行旋转。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉王科技股份有限公司,未经汉王科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110163213.2/1.html,转载请声明来源钻瓜专利网。