[发明专利]单词识别方法和信息处理装置有效
申请号: | 201010521928.6 | 申请日: | 2010-10-26 |
公开(公告)号: | CN102110229A | 公开(公告)日: | 2011-06-29 |
发明(设计)人: | 相泽知祯 | 申请(专利权)人: | 欧姆龙株式会社 |
主分类号: | G06K9/72 | 分类号: | G06K9/72 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 胡金珑 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 单词 识别 方法 信息处理 装置 | ||
技术领域
本发明涉及以下技术:根据将通过由照相机或作图处理等而生成的字符串的图像作为对象的识别处理,构成字符串的各个字符的候选字符分别与可靠度一同导出的情况,识别对应于字符串的单词。
背景技术
在一般的字符识别处理中,将识别对象的字符串的图像进行2值化之后,从2值图像中分别切出与各个字符对应的区域,并将各个区域的图像分别与以字符的每个种类注册的样本图像进行比对,将与在获得最高相似度时使用的样本图像对应的字符确定为对应于图像中的字符的字符。
但是,由于存在根据处理对象的图像的状态而发生错误识别的情况,所以提出了考虑了这个点的识别处理方法。例如,在专利文献1中,记载了使用通过识别的字符而生成的字符串来检索词典,若在词典中有与检索对象的字符串相同的字符串,则判定为识别结果正确并确定字符串,在找不到与检索对象的字符串相同的字符串的情况下,重新进行字符识别处理。
此外,在专利文献2中,记载了以下等:对在字符识别对象数据中包含的每个字符生成多个识别候选字符和识别可靠度的组合之后,将各个识别候选字符组合成多个组而生成候选单词;依次使用优先度高的候选单词而检索单词词典,筛选在单词词典中包含的信息(词典单词);从筛选出的词典单词中选定与候选单词的相似度最高的单词。
【专利文献1】特开平5-46814号公报
【专利文献2】特开2006-163830号公报
如上述的各个文献所述,若采用通过候选字符的组合而比对单词数据库的方法,则存在设定多个组合,从而处理时间变长的顾虑。关于这一点,以下使用具体例子进行说明。
图10(1)是作为字符识别对象的图像的例子,表示通过拍摄“三三九度”这样的字符串而生成的图像。图10(2)是通过对于该图像中的4个字符的识别处理而导出的候选字符化为表的形式而制成表的图,在该例子中,作为对每个字符获得5个候选字符,将这些候选字符按照可靠度由高到低的顺序配置。
另外,在该说明书中所称的可靠度,基于在将从图像切出的字符区域与字符的样本图像比对时所获得的两者之间的相似度而设定。
根据图10(2)的例子,对识别对象的字符串的第2个字符“三”和第4个字符“度”,正确的字符分别设定为第1位的候选字符,但对于第1个字符“三”和第3个字符“九”,错误的字符分别设定为第1位的候选字符。
图10(3)相关联而示出图10(2)所示的各个候选字符的组合例子和使用通过组合而生成的字符串比对了单词数据库的结果(X标记表示没有找到对应的单词的情况,O标记表示找到了对应的单词的情况)。在该例子中,将各个候选字符以可靠度由高到低的顺序选择而设定组合,且每次以一个字符一个字符变更组合中的候选字符而与单词数据库内的单词比对,但由于上位的候选字符设定为错误的字符,所以比对不能顺利成功。因此,用于确定正确的单词需要相当长的时间。此外,若根据该方法,识别对象的字符串的字符串长度越长,则候选字符的组合数越增加,处理所需的时间也越长。
这样,在上述的方法中,存在虽然能够识别正确的单词,但处理时间相当长的可能性,所以难以应用于将其他处理并列执行的类型的设备。例如,在设定了字符识别功能的便携电话中,在进行字符识别处理时受到被叫的情况下,需要进行通知被叫的效果音的输出和显示,但若字符识别处理延长,则存在不能迅速地进行被叫的报告,对便携电话的基本功能产生妨碍的顾虑。
发明内容
本发明是着眼于上述的问题而完成的,其课题在于,缩短用于确定对应于识别对象的字符串的单词的处理时间。
本发明的单词识别方法是,作为字符串图像的识别处理结果,在构成字符串的每个字符取得了一个以上的候选字符后,使用注册了多个单词的单词数据库来识别对应于字符串的单词的方法。另外,在对于字符串的图像的识别处理中,优选对各个候选字符设定基于通过与字符识别时的样本图像的比对而导出的相似度的可靠度。表示可靠度的高度的数值,存在可靠度越高则变化为越大的值的情况,也有可靠度越高则变化为越小的值的情况。
在本发明的单词识别方法中,将在单词数据库中包含的规定数的单词设定为初始的候选单词。并且,在每次将构成识别对象的字符串的各个字符以一个字符一个字符设定为处理对象,并且设定处理对象的字符时,将该设定时的候选单词作为对象,执行将候选单词筛选为如下结构的单词的处理,即,在识别对象的字符串中,在与配置处理对象的字符的位置相同的位置配置对该处理对象的字符所取得的候选字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于欧姆龙株式会社,未经欧姆龙株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010521928.6/2.html,转载请声明来源钻瓜专利网。