[发明专利]字符识别装置、字符识别方法及程序在审
申请号: | 201680050583.6 | 申请日: | 2016-09-01 |
公开(公告)号: | CN107949852A | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 吉田笃弘;黑泽由明 | 申请(专利权)人: | 株式会社东芝;东芝数字解决方案株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/03 |
代理公司: | 永新专利商标代理有限公司72002 | 代理人: | 戚宏梅 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 装置 方法 程序 | ||
1.一种字符识别装置,其中,具备:
字符串图像取得部,取得字符串图像;
结合图表生成部,对所述字符串图像进行字符识别处理,生成将多个表示被视为1个字符的每个字符区域的识别结果的字符候选信息、按照所述字符串图像中的各字符区域的排列顺序进行连接而得的结合图表,多个所述字符候选信息分别包含有1个以上候选字符;
结合图表统合部,对根据包含有同一字符串的多个所述字符串图像生成的多个所述结合图表、或者通过对1个所述字符串图像进行多个不同字符识别处理而生成的多个所述结合图表进行统合;以及
输出部,输出统合后的所述结合图表或者基于统合后的所述结合图表得到的识别字符串。
2.如权利要求1所述的字符识别装置,其中,
所述结合图表统合部在将要统合的多个所述结合图表设为第1结合图表及第2结合图表时,确定所述第1结合图表中包含的所述字符候选信息与所述第2结合图表中包含的所述字符候选信息之间的对应关系,将所述第1结合图表与所述第2结合图表中对应的所述字符候选信息彼此合并成1个所述字符候选信息,并且,将所述第2结合图表中包含的、且与所述第1结合图表中包含的任意的所述字符候选信息都不对应的所述字符候选信息向所述第1结合图表追加,由此,对所述第1结合图表和所述第2结合图表进行统合。
3.如权利要求2所述的字符识别装置,其中,
所述字符候选信息包含有表示所述字符串图像中的字符区域的位置的位置信息,
所述结合图表统合部基于所述位置信息,确定所述第1结合图表中包含的所述字符候选信息与所述第2结合图表中包含的所述字符候选信息之间的对应关系。
4.如权利要求3所述的字符识别装置,其中,
所述结合图表统合部在对根据包含有同一字符串的多个所述字符串图像生成的多个所述结合图表进行统合的情况下,进行多个所述字符串图像的对位,基于与该对位的结果相应地进行了变换的所述位置信息,确定所述第1结合图表中包含的所述字符候选信息与所述第2结合图表中包含的所述字符候选信息之间的对应关系。
5.如权利要求2所述的字符识别装置,其中,
所述结合图表统合部利用松弛法来确定所述第1结合图表中包含的所述字符候选信息与所述第2结合图表中包含的所述字符候选信息之间的对应关系。
6.如权利要求2所述的字符识别装置,其中,
在所述结合图表中,对应于所述字符串图像中的字符区域的划分不同的多个类型,包含有多个表示各类型中的所述字符候选信息的连接的连接路径,
所述结合图表统合部在将所述第1结合图表和所述第2结合图表分别分离成单个所述连接路径后,确定所述第1结合图表的所述连接路径与所述第2结合图表的所述连接路径之间的对应关系,将所述第1结合图表与所述第2结合图表中对应的所述连接路径中包含的所述字符候选信息彼此合并成1个所述字符候选信息,并且,将所述第2结合图表的与所述第1结合图表的任意的所述连接路径都不对应的所述连接路径中包含的所述字符候选信息向所述第1结合图表的某个所述连接路径追加之后,将所述第1结合图表的多个所述连接路径结合起来,由此,对所述第1结合图表和所述第2结合图表进行统合。
7.如权利要求2至6中任一项所述的字符识别装置,其中,
所述结合图表包含有表示相邻的所述字符候选信息彼此的连接关系的连接信息,
所述结合图表统合部对所述第1结合图表中包含的所述连接信息追加与所述第2结合图表中包含的所述字符候选信息之间的连接关系,由此,将所述第2结合图表中包含的所述字符候选信息向所述第1结合图表追加。
8.一种字符识别方法,其中,包括如下步骤:
取得字符串图像的步骤;
对所述字符串图像进行字符识别处理,生成将多个表示被视为1个字符的每个字符区域的识别结果的字符候选信息、按照所述字符串图像中的各字符区域的排列顺序进行连接而得的结合图表的步骤,多个所述字符候选信息分别包含有1个以上候选字符;
对根据包含有同一字符串的多个所述字符串图像生成的多个所述结合图表、或者通过对1个所述字符串图像进行多个不同字符识别处理而生成的多个所述结合图表进行统合的步骤;和
输出统合后的所述结合图表或者基于统合后的所述结合图表而得到的识别字符串的步骤。
9.一种程序,用于使计算机实现如下功能:
取得字符串图像的功能;
对所述字符串图像进行字符识别处理,生成将多个表示被视为1个字符的每个字符区域的识别结果的字符候选信息、按照所述字符串图像中的各字符区域的排列顺序进行连接而得的结合图表的功能,多个所述字符候选信息分别包含有1个以上候选字符;
对根据包含有同一字符串的多个所述字符串图像生成的多个所述结合图表、或者通过对1个所述字符串图像进行多个不同字符识别处理而生成的多个所述结合图表进行统合的功能;和
输出统合后的所述结合图表或者基于统合后的所述结合图表而得到的识别字符串的功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝;东芝数字解决方案株式会社,未经株式会社东芝;东芝数字解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680050583.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于检测图像数据中的关键点的方法和系统
- 下一篇:操作者识别和表现追踪