[发明专利]图像识别方法和图像识别设备在审
申请号: | 201610065491.7 | 申请日: | 2016-01-29 |
公开(公告)号: | CN107025452A | 公开(公告)日: | 2017-08-08 |
发明(设计)人: | 许亮;范伟;孙俊;直井聪 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 朱胜,李春晖 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 设备 | ||
1.一种用于对具有表格结构的输入图像进行识别的图像识别方法,其中所述输入图像包含有一个或多个预打印字符串以及一个或多个后打印字符串,所述图像识别方法包括:
提取步骤,用于从所述输入图像中提取出所述表格结构;
定位步骤,用于基于所述表格结构的先验知识,获得所述一个或多个后打印字符串中的至少一个后打印字符串的位置信息;以及
识别步骤,对于所述至少一个后打印字符串中的每个后打印字符,采用基于二值化图像的第一字符分类器和基于灰度图像的第二字符分类器来对该后打印字符进行识别。
2.根据权利要求1所述的图像识别方法,其中,在所述识别步骤中,在对输入到所述第二字符分类器的所述灰度图像进行归一化时,基于所述灰度图像的背景像素的灰度值来填充该灰度图像,以使得该灰度图像具有预定的长宽比。
3.根据权利要求2所述的图像识别方法,其中,基于所述背景像素的灰度值的均值或中值来填充该灰度图像。
4.根据权利要求1所述的图像识别方法,其中,在所述识别步骤中,所述第一字符分类器首先对所述二值化图像中的最大连通块子图像进行识别,若该识别的结果的置信度低,则所述第一字符分类器再对整个所述二值化图像进行识别,并且选择这两个识别中置信度高的识别结果作为最终识别结果。
5.根据权利要求1所述的图像识别方法,还包括分离步骤,用于基于颜色信息来从所述输入图像中分离出所述至少一个后打印字符串的图像。
6.根据权利要求5所述的图像识别方法,其中,在所述识别步骤中, 对于所述至少一个后打印字符串中的每个后打印字符,采用基于所述输入图像而生成的二值化图像和灰度图像分别作为所述第一字符分类器和所述第二字符分类器的输入来对该后打印字符进行识别从而得到第一识别结果,还采用基于所述至少一个后打印字符串的图像而生成的二值化图像和灰度图像分别作为所述第一字符分类器和所述第二字符分类器的输入来对该后打印字符进行识别从而得到第二识别结果,并且选择所述第一识别结果和所述第二识别结果中置信度高的识别结果作为最终识别结果。
7.根据权利要求5所述的图像识别方法,其中,在所述识别步骤中,基于所述至少一个后打印字符串的图像来进行字符切分。
8.根据权利要求1所述的图像识别方法,其中,在所述识别步骤中,若采用所述第一字符分类器得到的识别结果的置信度低或者该识别结果的第一候选和第二候选的概率之差小,则采用所述第二字符分类器来进行识别,并且选择这两个识别中置信度高的识别结果作为最终识别结果。
9.根据权利要求1所述的图像识别方法,其中,在所述定位步骤中,基于所述表格结构中的各区域的相对位置,选择如下区域作为所述至少一个后打印字符串中的每个后打印字符串的区域:该区域包含所述表格结构中的与该后打印字符串对应的区域且比所述表格结构中的与该后打印字符串对应的区域更大。
10.一种用于对具有表格结构的输入图像进行识别的图像识别设备,其中所述输入图像包含有一个或多个预打印字符串以及一个或多个后打印字符串,所述图像识别设备包括:
提取单元,被配置成从所述输入图像中提取出所述表格结构;
定位单元,被配置成基于所述表格结构的先验知识,获得所述一个或多个后打印字符串中的至少一个后打印字符串的位置信息;以及
识别单元,被配置成对于所述至少一个后打印字符串中的每个后打印字符,采用基于二值化图像的第一字符分类器和基于灰度图像的第二字符分类器来对该后打印字符进行识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610065491.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序