[发明专利]模板优化的字符识别方法和系统有效
申请号: | 200510090877.5 | 申请日: | 2005-08-18 |
公开(公告)号: | CN1916940A | 公开(公告)日: | 2007-02-21 |
发明(设计)人: | 刘芝;康凯;徐剑波 | 申请(专利权)人: | 北大方正集团有限公司;北京北大方正技术研究院有限公司 |
主分类号: | G06K9/68 | 分类号: | G06K9/68 |
代理公司: | 北京同达信恒知识产权代理有限公司 | 代理人: | 李欣 |
地址: | 100871北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种模板优化的字符识别方法和系统。由训练字符集中至少一个训练字符构成一个字型,公共模板提取单元将所述字型逐次放到与其在不同组成部分上相似的字型所组成的不同待聚类集合中进行聚类并提取公共模板,参考提取出来的多级公共模板,提取所述字型的最后一级公共模板,将提取出来的该字型的各级公共模板保存到字典的模板存储模块中。模板输出单元将每个字型的内码与指向该字型各级公共模板的指针对应存储,以生成该字型的索引表并保存到字典的字型索引表存储模块中。在识别单元对待识字符集进行识别时,其中的公共模板匹配模块将一个待识字符与找到的一个字型索引表所指向的各级公共模板进行逐级匹配并记录匹配结果,以获取候选字符。 | ||
搜索关键词: | 模板 优化 字符 识别 方法 系统 | ||
【主权项】:
1、一种模板优化的字符识别方法,该方法包括步骤:由训练字符集中至少一个训练字符构成一个字型,将所述字型逐次放到与其在不同组成部分上相似的字型所组成的不同待聚类集合中进行聚类并提取公共模板,将提取出来的所述字型的多级公共模板保存起来;参考提取出来的多级公共模板,提取所述字型的最后一级公共模板并保存起来;对于每个字型,将其内码与指向其各级公共模板的指针对应存储,以生成所述字型的索引表;对待识字符集进行识别时,将一个待识字符与找到的一个字型索引表所指向的各级公共模板进行逐级匹配并记录匹配结果,以获取候选字符。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京北大方正技术研究院有限公司,未经北大方正集团有限公司;北京北大方正技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200510090877.5/,转载请声明来源钻瓜专利网。