[发明专利]字符识别方法、程序以及记录介质有效
申请号: | 01125224.3 | 申请日: | 2001-08-31 |
公开(公告)号: | CN1351312A | 公开(公告)日: | 2002-05-29 |
发明(设计)人: | 柏岡润二;藤本克仁 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/36 | 分类号: | G06K9/36;G06K9/62 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 吴丽丽 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 方法 程序 以及 记录 介质 | ||
技术领域
本发明涉及字符识别方法、程序以及记录介质。
近几年来,广泛使用字符识别技术将书写或印刷在纸张上的字符,输入到计算机中。为了指示诸如文档之类的纸张上的字符的输入位置,在纸张正面印刷引导字符或标尺线(以下称为预印信息),从而允许在大部分情况下在引导字符或标尺线附近输入字符。
在此类情况中,由于存在预印信息,所以正确识别输入字符就变得比较困难。因此需要改进。
背景技术
图28表示书写在预印信息上的字符示例。如该图所示,在本示例中,预印表示货币量的单位千万、百万、十万、万、千、百、十和个,以及表示用于书写与货币单位相对应的字符(数字)的框架的标尺线,从而用户能够在纸张上输入手写字符(数字)。
以下说明用于识别在包含预印信息的纸张上书写的字符的常规方法。通过使用与预印信息有关的已知信息,从包含预印信息的读取信息中删除预印信息,以仅仅留下需要识别的输入字符信息。此时,通过使用已知信息,如存在预印字符或标尺线的区域中的位置信息,以及预印信息的种类,可以删除预印字符或标尺线。在能够以灰度级图像方式读取文件的情况中,存在一种字符识别方法,其中如果预印信息和识别字符之间存在灰度级差值,则使用灰度级差值来抽取仅仅需要识别的字符,以实现字符识别。
对于上述常规方法,删除预印信息的方法具有以下问题,即,如果没有有关预印信息的知识,则不能正确地执行字符识别。同时,即使可以利用另一种方法抽取预印信息,在某些情况中也可能出现抽取错误,或者,当识别字符中残留有标尺线或预印信息时,字符识别结果可能是错误的。
另外,当由于系统限制而不能以灰度级图像方式获得文档时,或者预印信息和识别字符之间的灰度级没有什么差别时,存在以下问题,即不能根据灰度级信息抽取识别字符。
发明内容
本发明的第一目的在于解决上述问题,并提供字符识别方法、程序和记录介质,其中无需使用预印信息的知识或灰度级差值,也能识别与预印信息接触或叠加在预印信息上的字符。
如图29所示,我们根据本发明提出了一种能够实现第一目的的、新的字符识别方法,但是此字符识别方法可能引起错误识别。
图29表示某些错误识别实例。根据实现第一目的的字符识别方法,对于在图28所示的预印信息上书写的字符而言,将图29之(a)、(b)、(c)中左侧所示的图像,识别为右侧所示的图像,并作为识别结果。更确切地说,如图29的(a)所示,当在预印信息上书写沿纵向方向具有一条线段的数字“7”时,由于“7”的纵向线段部分,识别结果可能是错误的,如将“7”识别为“1”。同时,如图29的(b)所示,当在预印信息上书写数字“8”时,可能将组成“8”的两个圆圈中的一个圆圈错误识别为“0”。同样,对于要识别的原始字符,可能将某个字符错误识别为与该字符的部分模式接近的另一个字符。同时,如图29的(c)所示,当在预印信息上书写数字“0”时,由于与“0”交叉的线段,可能将“0”错误识别为“6”(或“8”)。
本发明的第二目的在于通过防止实现第一目的的方法可能出现错误识别,提供正确的识别结果。
实现第一目的的本发明的第一基础发明是一种字符识别方法,用于识别在包含预印信息之类的文档中输入的字符。该方法包括以下步骤:将其中存在要识别字符的区域内的图像分割为独立线段,其中通过读取所述预印信息以及输入字符获得该图像;通过改变众多已分割线段的组合,创建识别图像;通过对所述创建的识别图像进行字符识别,存储具有可靠性的识别结果;以及通过在连续改变所述线段的组合时,对所有组合进行字符识别,输出具有最高可靠性的识别结果。
与实现第一目的的第一基础发明有关的另一发明是一个字符识别程序。该程序包含以下步骤。
将其中存在要识别字符的区域内的图像分割为独立线段,其中通过读取在包含预印信息的文档内输入的字符获得该图像;通过改变众多已分割线段的组合,创建识别图像;通过对所述创建的识别图像进行字符识别,存储具有可靠性的识别结果;以及通过在连续改变所述线段的组合时,对所有组合进行字符识别,输出具有最高可靠性的识别结果。
与第一基础发明有关的另一发明是一种存储字符识别程序的计算机可读介质。该程序包含以下功能。
将其中存在要识别字符的区域内的图像分割为独立线段,其中通过读取在包含预印信息的文档内输入的字符获得该图像;通过改变众多已分割线段的组合,创建识别图像;通过对所述创建的识别图像进行字符识别,存储具有可靠性的识别结果;以及通过在连续改变所述线段的组合时,对所有组合进行字符识别,输出具有最高可靠性的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/01125224.3/2.html,转载请声明来源钻瓜专利网。