[发明专利]字符识别系统及字符识别方法有效
申请号: | 201510785494.3 | 申请日: | 2015-11-16 |
公开(公告)号: | CN105608453B | 公开(公告)日: | 2019-05-03 |
发明(设计)人: | 横井博树;中岛和树 | 申请(专利权)人: | 株式会社日立信息通信工程 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/68 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 田喜庆;吴孟秋 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 系统 方法 | ||
本发明提供即使在包括字符种类不同的复式记录的票据时也能提高精度和效率并能减轻用户的作业负担的字符识别系统及字符识别方法。字符识别系统包括:票据输入部,获得票据的图像数据;字符识别部,根据票据的图像数据,对作为两个字段的两个字符串的第一字段的第一字符串和第二字段的第二字符串进行字符识别,获得识别结果字符数据;转换部,根据识别结果字符数据,当第一字符串的字符种类与第二字符串的字符种类不同时,将一个字符串转换成与另一个字符串字符种类匹配,获得转换结果字符数据;比较部,根据转换结果字符数据,比较第一字符串和第二字符串,判断一致或不一致,获得比较结果数据;及输出部,向用户输出包括比较结果数据的输出数据。
技术领域
本发明涉及利用OCR(Optical Character Reader:光符阅读器)的字符识别技术。
背景技术
利用了OCR的字符识别系统从账单、支票等票据读取图像,识别记在票据栏中的字符,获得其字符数据。用户通过画面查看该字符数据,进行票据填入内容的确认,数据的修改或确定等作业。
作为利用了OCR的字符识别系统相关的在先技术的例子,例如可列举日本特开2002-92545号公报(专利文献1)。专利文献1中公开了对填在票据两栏中的两个金额的字符进行字符识别的内容。
在先技术文献
专利文献
专利文献1:日本特开2002-92545号公报
发明内容
发明要解决的技术问题
有时会在票据中的两栏或者两处填入具有对应关系的两个字符串作为复式记录。对于金额等重要的信息,有时出于确保正确性、防止窜改等目的进行复式记录。复式记录有时还被称为复填。有些票据中同时设有用于复式记录的两个栏。例如,在账单中,往金额的填入栏填入金额的字符串,往复填栏中填入与填入栏的金额相同金额的字符串。
现有的字符识别系统在对票据的复式记录的两个字符串只是分别进行字符识别来获得数据时,未对两个字符串的对应关系进行判断。这时,用户获得错误的金额等字符串的可能性、没有注意到两个字符串不一致的可能性高。
专利文献1中公开的技术是适用于在票据的两栏中以相同种类的字符、例如阿拉伯数字填入了相同金额的情况的技术。
但是,也存在在票据的复式记录的两栏或者两处以不同种类的字符填入或印刷相同金额的情况。例如,在填入栏以阿拉伯数字填入金额,在复填栏中以汉字数字填入相同的金额。如果是没有复填栏的票据,有时也会在接近填入栏的地方填入金额。
在上述情况下,由于两个金额的字符种类不同,因此,现有的字符识别系统无法进行简单比较以及对应关系的判断等。用户需要看两个金额的字符识别结果,对两个金额进行比较来判断及确认是否有金额的误填、窜改等可能性。用户需要对每个票据进行这样的作业,消耗劳力和时间。
尤其是,当两个金额的字符种类不同时,与字符种类相同时相比,用户更加难以一眼就能进行金额的比较、判断。并且,当介入有用户的票据确认等作业时,进行多个票据的处理的字符识别系统需要暂停处理。为此,为了处理多个票据需要消耗较长时间,用户的作业负担增大。
如上所述,关于包括复式记录的票据的字符识别,现有的字符识别系统从精度、效率的观点来看具有改善的余地。
本发明的目的在于,针对字符识别系统,提供一种即使在包括字符种类不同的复式记录的票据时,也能提高精度和效率,减轻用户的作业负担的技术。
用于解决技术问题的方案
本发明中的代表性的实施方式是一种字符识别系统以及字符识别方法,其特征在于具有以下所示的构成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立信息通信工程,未经株式会社日立信息通信工程许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510785494.3/2.html,转载请声明来源钻瓜专利网。