[发明专利]字符识别装置、字符识别方法及程序在审
申请号: | 201680050583.6 | 申请日: | 2016-09-01 |
公开(公告)号: | CN107949852A | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 吉田笃弘;黑泽由明 | 申请(专利权)人: | 株式会社东芝;东芝数字解决方案株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/03 |
代理公司: | 永新专利商标代理有限公司72002 | 代理人: | 戚宏梅 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 装置 方法 程序 | ||
技术领域
本发明的实施方式涉及字符识别装置、字符识别方法及程序。
背景技术
在以OCR(Optical Character Recognition/Reader)为代表的字符识别的领域中,进行了用于实现识别精度的提高的各种尝试。例如已知有如下技术:对含有同一字符串的多个字符串图像分别进行字符识别处理,对于对应的字符选择信赖度高的识别结果而得到最终的识别字符串。
但是,在选择信赖度高的识别结果的以往的方法中,例如由于信赖度高的识别结果未必正确、有时字符串图像中的字符的划分不正确,因此得不到正确的识别字符串的情况也很多,需要进一步的改善。
现有技术文献
专利文献
专利文献1:特开2003-331217号公报
发明内容
发明要解决的课题
本发明所要解决的课题在于提供一种能够进行高精度的字符识别的字符识别装置、字符识别方法及程序。
用于解决课题的手段
实施方式的字符识别装置具备字符串图像取得部、结合图表生成部、结合图表统合部和输出部。字符串图像取得部取得字符串图像。结合图表生成部对所述字符串图像进行字符识别处理,生成将多个表示被视为1个字符的每个字符区域的识别结果的字符候选信息、按照所述字符串图像中的各字符区域的排列顺序进行连接而得的结合图表,多个所述字符候选信息分别包含有1个以上候选字符。结合图表统合部对根据包含有同一字符串的多个所述字符串图像生成的多个所述结合图表、或者通过对1个所述字符串图像进行多个不同字符识别处理而生成的多个所述结合图表进行统合。输出部输出统合后的所述结合图表或者基于统合后的所述结合图表而得到的识别字符串。
附图说明
图1是表示字符识别装置的硬件构成例的框图。
图2是表示字符识别装置的功能性构成例的框图。
图3是表示结合图表的一例的图。
图4是用于说明结合图表的数据构造的一例的图。
图5是表示累积结合图表及新结合图表的一例的图。
图6是表示将图5所示的新结合图表统合到累积结合图表中而得到的新的累积结合图表的图。
图7是表示字符识别装置的处理步骤的一例的流程图。
图8是用于说明图7的步骤S105的统合处理的概要的流程图。
图9是表示图8的步骤S205的处理步骤的流程图。
图10是抽取图5所例示的累积结合图表及新结合图表的一部分字符候选信息来表示的图。
图11是表示将结合图表分离成单个连接路径的样态的图。
具体实施方式
以下,参照附图来详细地说明实施方式的字符识别装置、字符识别方法及程序。
图1是表示实施方式的字符识别装置10的硬件构成例的框图。字符识别装置10例如能够采用作为一般的计算机的硬件构成。该情况下,字符识别装置10如图1所示那样具备:CPU(Central Processing Unit)101、ROM(Read Only Memory)102、RAM(Random Access Memory)103、HDD(Hard Disk Drive)104、设备I/F105、网络I/F106、对上述的各部分进行连接的总线107等。然后,字符识别装置10例如通过由CPU101将RAM103用作工作区域并执行在ROM102或HDD104等中保存的程序,从而实现与字符识别有关的各种功能。
设备I/F105是用于将液晶显示器等显示装置108、键盘或鼠标等操作输入装置109、摄像机或扫描仪等图像输入装置110这样的外围设备连接于字符识别装置10的接口。网络I/F106是用于将字符识别装置10连接于互联网或LAN(Local Area Network)等网络的通信接口。
图2是表示实施方式的字符识别装置10的功能性构成例的框图。字符识别装置10例如作为通过上述的硬件和软件(程序)的配合而实现的功能性构成要素,而如图2所示那样具备字符串图像取得部11、结合图表生成部12、结合图表统合部13、识别字符串生成部14、输出部15。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝;东芝数字解决方案株式会社,未经株式会社东芝;东芝数字解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680050583.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于检测图像数据中的关键点的方法和系统
- 下一篇:操作者识别和表现追踪