[发明专利]一种笔迹特征提取的方法和装置有效
申请号: | 201410247878.5 | 申请日: | 2014-06-05 |
公开(公告)号: | CN104063705B | 公开(公告)日: | 2017-08-11 |
发明(设计)人: | 曹骥;李健;张连毅;武卫东 | 申请(专利权)人: | 北京捷通华声语音技术有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/68 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 兰淑铎 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 笔迹 特征 提取 方法 装置 | ||
技术领域
本申请涉及联机手写汉字识别技术领域,特别是涉及一种笔迹特征提取的方法和装置。
背景技术
联机手写的笔迹数据,由于书写者的书写习惯、笔迹采集设备的精度的不同,对于相同的文字,存在很大的形变和图形上的差异,因此,对于笔迹数据的特征提取提出了更高的要求,需要在笔迹数据特征提取时能够有效的表达手写笔迹数据的本质,体现相同字的笔迹数据的相同点,并区分不同字的笔迹数据的不同点。
目前传统笔迹数据的特征提取方法,是通过对笔迹数据进行顺序扫描方法和网格统计方法进行笔迹数据特征的提取。其中,笔迹数据进行顺序扫描方法是按照书写的顺序对笔迹数据中的点位置或角度进行扫描,该方法未考虑笔迹数据特征中的轨迹的角度变化信息,也未考虑笔迹数据特征相邻角度间的相似性。网络统计方法是按照等宽和等高的方式进行笔迹数据特征的提取,该方法未考虑笔迹数据特征对称投影的信息,并且,该方法存在手写笔迹特征的提取过于机械、规整以及形变适应性不佳的问题。
上述方法,存在笔迹数据特征提取不全面和笔迹数据特征适应性不佳的问题,以上问题严重影响了后续分类器的分类效果,进而导致了联机手写笔迹数据特征识别准确率低的问题。
发明内容
本申请提供一种笔迹特征提取的方法和装置,以解决联机手写笔迹数据特征识别准确率低的问题。
为了解决上述问题,本申请公开了一种笔迹特征提取的方法,包括:
按照笔迹数据书写的时间序列采集笔迹数据并进行预处理,获得预处理后的笔迹数据;
依据所述时间序列对所述预处理后的笔迹数据进行等间隔分段,获得多个笔画段向量;
获取所述多个笔画段向量的联机特征,所述联机特征包括所述多个笔画段向量的角度和中心坐标;
根据所述预处理后的笔迹数据获取所述笔迹数据的重心,依据所述重心提取所述预处理后的笔迹数据的脱机特征;
依据所述联机特征和脱机特征,进行数值归一化处理,将所述数值归一化处理的结果作为采集的所述笔迹数据的特征。
优选地,所述按照笔迹数据书写的时间序列采集笔迹数据并进行预处理,获得预处理后的笔迹数据的步骤包括:
将采集的笔迹数据按照书写的时间序列进行线性尺寸规整化后,获得各个自然笔画段长度;
依据获得的所述各个自然笔画段长度,得到由所述各个自然笔画段组成的笔迹数据的长度。
优选地,所述多个笔画段向量的角度包括:各个笔画段向量与X轴正方向的角度、各个笔画段向量与Y轴正方向的角度以及各个笔画段向量与其相邻的笔画段向量之间的角度。
优选地,其特征在于,所述脱机特征包括投影脱机特征、或网格脱机特征、或扇形脱机特征、或轮廓脱机特征。
优选地,当所述脱机特征为所述投影脱机特征时,所述依据所述重心提取所述预处理后的笔迹数据的脱机特征的步骤包括:
以所述笔迹数据的重心为分割点对所述预处理后的笔迹数据进行水平方向分割和垂直方向分割,将所述预处理后的笔迹数据从水平方向分割为上部分区域和下部分区域,从垂直方向分割为左部分区域和右部分区域,分别扫描各个笔画段向量的中心坐标在所述上部分区域、下部分区域、左部分区域和右部分区域出现的个数;
当所述脱机特征为所述网格脱机特征时,所述依据所述重心提取所述预处理后的笔迹数据的脱机特征的步骤包括:
定义二维平面的八个方向,东、西、南、北、东南、东北、西南、西北;
以所述笔迹数据的重心为分割点对所述预处理后的笔迹数据进行水平方向分割和垂直方向分割,将所述预处理后的笔迹数据从水平方向分割为上网格和下网格,从垂直方向分割为左网格和右网格,分别扫描各个笔画段向量的中心坐标在所述上网格、下网格、左网格和右网格的八个方向上出现的个数;
当所述脱机特征为所述扇形脱机特征时,所述依据所述重心提取所述预处理后的笔迹数据的扇形脱机特征的步骤包括:
定义二维平面的八个方向,东、西、南、北、东南、东北、西南、西北;
以所述笔迹数据的重心为圆心,对所述预处理后的笔迹数据分割为多个扇形区域,分别扫描各个笔画段向量的中心坐标在八个方向上出现的个数;
当所述脱机特征为所述轮廓脱机特征时,所述依据所述重心提取所述预处理后的笔迹数据的轮廓脱机特征的步骤包括:
定义二维平面的八个方向,东、西、南、北、东南、东北、西南、西北;
以所述笔迹数据的重心为结束点,分别扫描各个笔画段向量的中心坐标在八个方向出现的个数。
为了解决上述问题,本申请还公开了一种笔迹特征提取的装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声语音技术有限公司,未经北京捷通华声语音技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410247878.5/2.html,转载请声明来源钻瓜专利网。