[发明专利]字符识别电子元件、装置、方法、程序及数据结构有效
申请号: | 200910004631.X | 申请日: | 2009-03-02 |
公开(公告)号: | CN101533476A | 公开(公告)日: | 2009-09-16 |
发明(设计)人: | 相泽知祯 | 申请(专利权)人: | 欧姆龙株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/20 |
代理公司: | 北京市柳沈律师事务所 | 代理人: | 钱大勇 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 电子元件 装置 方法 程序 数据结构 | ||
技术领域
本发明涉及例如对应于多个国家的语言进行字符识别的字符识别程序、字符识别电子元件、字符识别装置、字符识别方法以及数据结构。
背景技术
以往,提出了关于将多种语言作为识别对象的字符识别的各种技术。
例如,提出了按每个语言具有识别用辞典的字符识别系统(参照专利文献1)。该字符识别系统包括面向多个语言的特征量辞典以及面向多个语言的特征量提取程序,是下载用于想要识别的语言的特征量提取程序以及特征量辞典进行字符识别的系统。
此外,提出了将识别用辞典数据分割为内部存储器和存储器卡的便携式信息终端(参照专利文献2)。该便携式信息终端是,将字符识别程序和用于缩小候选的辞典数据下载到高速存储器中,并将详细辞典数据存储到终端所附属的存储器卡的终端。
此外,提出了具有对于多个语言的识别用辞典和每个语言的识别用辞典的字符识别装置(参照专利文献3)。该字符识别装置是,按每个字符种类具有辞典(例如日语辞典和英语辞典),根据识别对象的字符的种类适当地切换辞典的装置。该切换是,首先用英语辞典识别,如果是不可判读的字符则接着用日语辞典识别那样依次进行的切换。
但在这样的以往的字符识别中,若识别对象语言增加,则存在存储器使用量和处理时间增加的问题。
详细叙述的话,例如在将英语、德语、法语作为识别对象语言的情况下,字符“A”在英语、德语、法语中都使用。因此,在专利文献1、3那样按每个语言具有识别用辞典时在英语、德语、法语的任一个识别用辞典中都存在字符“A”的匹配信息,成为在存储器中重复存储。
同样地,数字或符号(“!”、“&”等)在哪个语言中都共同地使用。因此,在按每个语言具有识别用辞典时,数字或符号的匹配信息存在语言数 量,导致在存储器中重复存储。
此外,如专利文献2那样,在具有用于缩小候选的辞典数据的情况下,由于在原来的字符识别所需的详细辞典数据中加上用于缩小候选的辞典数据,所以整体的数据量变多,所需的存储容量变大。
另一方面,若为了减轻重复而将多个语言集中为一个识别用辞典,则匹配处理次数变得冗长,处理时间变长。例如在将日语和英语集中为一个的情况下,即使只想要将英语作为识别对象,也进行与日语的匹配信息之间的核对处理,处理变得冗长。
相对于此,例如上述专利文献3那样,将日语和英语(包含数字、符号)的匹配信息设为分别独立的识别用辞典的情况下,在将混杂了日语和英语的字符串设为识别对象时在辞典的切换上花费时间,处理时间还是增加。
在如便携式设备那样CPU能力弱并且存储器容量少的环境下,这样的问题成为非常大的问题。
[专利文献1]:(日本)特开平07-200737号公报
[专利文献2]:(日本)特开2005-141604号公报
[专利文献3]:(日本)特开2006-092138号公报
发明内容
本发明鉴于上述的问题,其目的在于,一并抑制由于识别对象语言的增加而引起的存储器使用量及处理时间的增加。
本发明是一种字符识别程序,在存储部件中预先存储辞典数据,所述辞典数据对各个注册字符数据赋予了一个或者多个用于分类字符的分类区分,所述字符识别程序使计算机执行以下步骤:分类区分指定步骤,通过指定部件指定所述分类区分;字符图像取得步骤,通过字符图像取得部件取得识别目的的字符图像;核对对象减少步骤,将核对对象减少为在所述辞典数据中注册的注册字符数据中赋予了通过所述指定步骤所指定的分类区分的注册字符数据;核对步骤,将该字符图像中的字符与通过所述核对对象减少步骤所减少的核对对象的各个注册字符数据进行核对;以及字符输出步骤,将核对结果所识别的字符通过输出部件输出。
所述分类区分可由如英语和日语那样可以区分语言的属性构成。此外,不仅是区分语言的属性,也可以由姓名、电话号码、E-mail、或者URL等语 言以外的属性构成。
所述指定部件可以由许可用户的输入操作而选择属性的操作单元、或者通过适当的处理而决定所述分类区分的处理单元等适当部件构成。
所述输出部件可以由进行画面显示的显示部件等进行输出的适当部件构成。
根据本发明,可以将在多个语言中通用的字符集中为赋予了多个语言的分类区分的一个注册字符数据,能够减少辞典数据的数据量。此外,通过核对对象减少步骤能够减少用于核对的注册字符数据,作为整体能够缩短核对时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于欧姆龙株式会社,未经欧姆龙株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910004631.X/2.html,转载请声明来源钻瓜专利网。