[其他]印刷体汉字识别方法无效

专利信息
申请号: 85105586 申请日: 1985-07-12
公开(公告)号: CN85105586A 公开(公告)日: 1986-07-02
发明(设计)人: 王雅延 申请(专利权)人: 王雅延
主分类号: G06K9/58 分类号: G06K9/58
代理公司: 抚顺市专利服务中心 代理人: 梁聪玖
地址: 辽宁省抚顺*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 印刷体 汉字 识别 方法
【说明书】:

发明属于印刷体文字的自动识别技术,进一步地说是关于印刷体汉字的识别方法。

在已有的文字识别技术中,通常采用图形重合法来识别印刷体文字。即用予先存储在机器内的样本字符逐个与被识别的字符进行重合,然后计算类似度,最后选取类似度最大的那个样本字符代表被识别的字符。图形重合法所采用的样本字符多以点阵的形式存储在识别装置或计算机的存储器中,对于中文来说,要想得到清晰的图形和必要的分辨率,每个汉字就需要用几百到几千比特的信息量来表示。要把所有的中文汉字都存入机器中,所需要的存储空间就会大的惊人,这即使在技术上可行,价格也是极其昂贵的,很难推广应用。为了解决这个问题,有人采用信息压缩法对汉字进行处理,即是提取汉字的部分特征,将每个字的特征信息存入存储器中,识别时,将这些特征信息调出与被识别的字的特征信息进行对照。该方法尽管取得了一些进展,但还是需要一个用来存储汉字样本的大容量的存储器,而且在信息压缩时,不小心会将有用的信息压缩掉,使识别精度受到影响,甚至不能识别。

采用已有的图形重合法识别文字计算量大、识别范围小、识别精度差、识别速度慢,而且不能判别字符由印刷质量差而产生的误差和本身特有的差异之间的区别,因而难于实现印刷体中文汉字的自动识别。

本发明的目的就是要解决以上问题,提供一种不需用计算机存储样本字符的存储方法和能够识别缺陷字的识别方法。

附图1是实施本方法的示意图

附图2是附图1中〔5〕字符识别判别器的示意图

附图3是样本字典〔1〕的示意图

本发明的要点在于样本字典〔1〕是由将样本字符〔30〕和其它符号印制在易于光学系统转换的介质上而构成的。识别时,将样本字典〔1〕中的样本字符〔30〕和被识别文稿〔2〕中的被识别字符经过样本字符转换器〔3〕和被识别文稿字符转换器〔4〕的光学系统同时分别投映在各自的光电转换板上,将被识别字符图形和样本字符图形转换为与字符图形相对应的电图形信号,经图像二值化处理后,送至字符识别判别器〔5〕。字符识别判别器〔5〕对来至两个转换器〔3〕〔4〕的图形信号自动进行逻辑判别,判别时,以样本字符二值图形为标准,将样本字符〔30〕与被识别字符的加肥和减瘦了的二值图形进行对照,对照字迹部分、对照字迹以外的空白部分、字迹与空白全对照、对照字迹的3/4部分和对照字迹以外的空白的3/4部分,如果完全相同,就将代表该字的代码暂存起来备用。当样本字典〔1〕中的所有样本字符〔30〕对照完后,给出一信号,将暂存起来的代码经字符识别判别器〔5〕按优先级别进行优先选择后,作为识别结果,存入文稿字符代码存储器〔7〕中。同时,将被识别文稿〔2〕推进一步,进行下一个字的识别。

样本字典〔1〕对样本字符〔30〕的存储是采用将各种字体的样本字符〔30〕印制在易于光学系统转换的介质上面实现的。印制在介质上的除了样本字符〔30〕以外,还有字符代码〔29〕、定位信号〔28〕、结尾信号〔31〕、标点符号〔32〕等,也可以采用缩微方法将这些信息缩制在介质上,介质可以为感光胶片。使用时,样本字典〔1〕与光学转换头进行相对高速运动,介质上印有的信息就周而复始地不断更换。再将样本字符〔30〕经样本字符转换器〔3〕转换成电信号,样本字典〔1〕就这样以极快的速度提供全部可用信息。

用于样本字符〔30〕和被识别字符的光电转换器〔3〕〔4〕包括三部分:(1)光学系统、光学系统是一个类似于照像机镜头那样的光学镜头组,用它将样本字符〔30〕和被识别字符的像分别投映到各自的光电转换板上。(2)光电转换板、光电转换板是光电元件组成的正方形矩阵、它将字符图形的光信号转换成模拟电信号。(3)二值化电路。它将模拟图形转换成二值图形,再将这两个两值图形并行送至字符识别判别器〔5〕进行逻辑判别。

用于被识别字符的光学系统还起着将各种不同规格的被识别字符的像调正到一个与样本字符〔30〕相同规格的作用。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王雅延,未经王雅延许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/85105586/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top