[发明专利]由字符图象直方图0-1图形表示识别字符的方法和装置无效

专利信息
申请号: 95118548.9 申请日: 1995-10-30
公开(公告)号: CN1041773C 公开(公告)日: 1999-01-20
发明(设计)人: 木村正行 申请(专利权)人: 北陆先端科学技术大学院大学长
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 中国国际贸易促进委员会专利商标事务所 代理人: 杜日新
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 字符 图象 直方图 图形 表示 识别 方法 装置
【说明书】:

本发明涉及一种用于识别纸上的字符图象的字符识别方法和装置。

字符识别装置适用于形成电子文件或数据库、文件处理、自动翻译、以及大容量的印刷文件处理的信息处理装置,并已进行了广泛的研究的研制。

用来识别纸上印刷的或手写的字符图象的常规的字符识别系统一般包括:(1)文件图象输入处理,(2)字符提取处理,(3)预处理(平滑、标准化、细线变换等),(4)特征提取处理,(5)大分类处理,(6)细分类处理,(7)记入(Post)处理等。

在这种字符识别系统中,纸上的字符图象作为光学图象被读取,并把光图象转变为电信号。读进系统中的字符图象例如根据边缘分布的直方图被提取进入识别单元,例如字符单元中。然后,被提取的字符经过预处理,以便有效地识别,在特征得取处理中,输入字符的特征,如拓朴特征、在被分成网格图形的象素单元中的特征等被提取,从而用结构分析法图形匹配法等进行识别处理。大分类处理专门用于例如具有大量字符种类的汉字字符,并用简单方法限制或缩小候选物。在细分类处理中,对经过限制的候选物进行更仔细地识别处理。而且,在记入处理中,当候选物不能借助于各个输入字符的识别处理被确定时,相邻的输入字符被连接,并参考适当的语法作为字符串判别。

常规字符识别系统具有如下问题。

在字符提取处理中,当有几个离散的字符连续地出现时,易于发生提取错误。这是决定字符识别精度的主要因素之一。作为有效的解决这一问题的措施,已知有一种用于改进和识别精度有关的字符提取方法。然而,这方法需要长的识别时间。

在特征提取处理中,被规格化成预定大小的字符图象在象素(位)单元中被扫描,字符的特征量(通过数字表示特征获得的)考虑扫描象素和其相邻的象素之间的关系被提取。这种特征量表示每个字符的整个的或全部的特征,但并不总是揭示出每个字符的突出的特征。因此,特征量容易受噪声的影响。

在常规的大分类或细分类中所用的字符识别中,进行图形匹配(距离计算)以便测量用特征量表示的未知的输入字符和字典中的标准图形的总体相似度,并按照较小的距离选择合适数量的候选类型。在这种常规的方法中,因为距离是分类的唯一标准,而使每个字符的突出的结构特征在分类过程中不能灵活地利用。为此,在常规的方法中,未知的输入图形必须和所有字符类型的标准图形进行比较。例如,当字符类型数量为5000时,就需要5000次距离计算。这一缺点是高速字符识别的严重障碍。而且,在这种字符识别处理中,难于检查分类或识别结果的有效性,因为识别错误的检查和校正操作被委托给记入处理,例如用大词典校对。这缺点也严重地阻碍了高速处理。

在另一方向,日本专利申请分开NOS.63-15383(图形校正装置),63-118993(字符识别方法),以及63-131287(字符识别系统)试图通过实现高速大分类来实现高速处理,所采用的方法与距离计算无关,并只对少数的受限制的候选字符类型进行距离计算。然而,在这些方法中,因为字符图象被扫描,并借助于检查在象素单元(一点)中的相邻象素的方法来提取特征工作为基本手段,因而所提取的特征容易受噪声影响,并且,要使用这种特征量来限制候选字符类型并具有高的精度是相当困难的。

如上所述,常规的字符识别方法和装置在抗噪声能力识别速度以及识别精度方面不能付诸满意地应用,这是由于所用的识别处理的性质决定的。

本发明是考虑上述情况作出的,其目的是提供一种字符识别的方法和装置,借助于同时改善抗噪能力、识别速度和识别精度来改善其实用性。

通过字符图象的直方图,借助于有效地利用与字符结构有关的信息,可以实现极高速的且只有极高的精度的字符识别。

更具体地说,按照本发明的字符识别装置包括:提取装置,用来从输入文件图象中提取预定的识别单元;直方图制备装置,用来根据每个提取的识别单元制备直方图;以及大分类装置,用来检索和识别单元一致的识别目标类别的候选物,通过部分地核对从由识别单元制备的直方图中提取的0-1图形表示和预先制奋的识别目标类别的0-1图形表示完成所述检索。

大分类装置最好预先制备识别目标类别的直方图,代替预先制备识别目标类别的0-1图形表示,并在检索时由各个识别目标类别的直方图来制备0-1图形表示。

该装置最好还包括细分类装置,用来检查检索的识别目标种类的候选的有效性。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北陆先端科学技术大学院大学长,未经北陆先端科学技术大学院大学长许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/95118548.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top