[发明专利]一种基于方向向量的文字识别方法和识别装置有效
申请号: | 201010221048.7 | 申请日: | 2010-06-28 |
公开(公告)号: | CN101893960A | 公开(公告)日: | 2010-11-24 |
发明(设计)人: | 李健;张连毅;武卫东 | 申请(专利权)人: | 北京捷通华声语音技术有限公司 |
主分类号: | G06F3/041 | 分类号: | G06F3/041;G06K9/20 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 方向 向量 文字 识别 方法 装置 | ||
1.一种基于方向向量的文字识别方法,其特征在于,所述方法包括:
接收输入笔迹信息;
求取所接收的笔迹信息的方向向量,并统计各方向向量的个数;
用所求取的方向向量和所统计的方向向量的个数构建矩阵A1,求取其特征向量T1;
将所述矩阵A1中各方向向量调整180度得到矩阵A2,求取其特征向量T2;
分别用特征向量T1和T2与预建的识别引擎的文字模型进行匹配,获取匹配度;
将所获取的匹配度进行排序,按照匹配度从高到低输出预设数量的文字。
2.如权利要求1所述的识别方法,其特征在于:
所述方向向量的取值范围为为0°到360°。
3.如权利要求2所述的识别方法,其特征在于:
所述调整180度具体指加上或减去180度。
4.如权利要求3所述的识别方法,其特征在于:
所述方向向量包括0°、45°、90°、135°、180°、225°、270°和315°8个方向的向量。
5.如权利要求1所述的识别方法,其特征在于,所述方法还包括:
在识别引擎中创建每一文字的文字模型。
6.如权利要求5所述的识别方法,其特征在于,所述创建每一文字的文字模型具体包括以下子步骤:
采集文字的输入样本;
提取各输入样本的方向向量,并统计各方向向量的个数;
分别用所求取的方向向量和所统计的方向向量的个数构建矩阵,求取其特征向量;
对所求取的各特征向量进行聚类;
存储聚类结果到识别引擎作为当前文字的文字模型。
7.一种基于方向向量的文字识别装置,其中特征在于,所述装置包括:
接收模块,用于接收输入笔迹信息;
处理模块,用于求取所接收的笔迹信息的方向向量,并统计各方向向量的个数;
第一求取模块,用于用所求取的方向向量和所统计的方向向量的个数构建矩阵A1,求取其特征向量T1;
第二求取模块,用于将所述矩阵A1中各方向向量调整180度得到矩阵A2,求取其特征向量T2;
匹配模块,用于分别用特征向量T1和T2与预建的识别引擎的文字模型进行匹配,获取匹配度;
输出模块,用于将所获取的匹配度进行排序,按照匹配度从高到低输出预设数量的文字。
8.如权利要求7所述的识别装置,其特征在于,所述装置还包括:
创建模块,在识别引擎中创建每一文字的文字模型。
9.如权利要求8所述的识别装置,其特征在于,所述创建模块包括以下子模块:
采集子模块,用于采集文字的输入样本;
提取子模块,用于提取各输入样本的方向向量,并统计各方向向量的个数;
构建子模块,用于分别用所求取的方向向量和所统计的方向向量的个数构建矩阵,求取其特征向量;
聚类子模块,用于对所求取的各特征向量进行聚类;
存储子模块,用于存储聚类结果到识别引擎作为当前文字的文字模型。
10.如权利要求9所述的识别装置,其特征在于:
所述方向向量包括0°、45°、90°、135°、180°、225°、270°和315°8个方向的向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声语音技术有限公司,未经北京捷通华声语音技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010221048.7/1.html,转载请声明来源钻瓜专利网。