[发明专利]一种基于标准模版的文档图像的信息定位方法无效
申请号: | 201210477308.6 | 申请日: | 2012-11-21 |
公开(公告)号: | CN103839058A | 公开(公告)日: | 2014-06-04 |
发明(设计)人: | 胡希驰;史培培;杨镜 | 申请(专利权)人: | 方正国际软件(北京)有限公司;方正国际软件有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 北京天悦专利代理事务所(普通合伙) 11311 | 代理人: | 田明;任晓航 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标准 模版 文档 图像 信息 定位 方法 | ||
技术领域
本发明图像处理领域,具体涉及一种基于标准模版的文档图像的信息定位方法。
背景技术
在文档图像处理中,有一类文档是一些具有特定模板的。比如各种证件、银行票据、快递运单、火车票等。对于此类文档图像的获取,可能会有扫描仪扫描的形式,也可能有相机、手机摄像头等移动、手持设备的拍摄。该类型的文档中,除了文字信息,往往还存在图像、表格,且排列方式比较多样(相比图书类文档);文字的背景有时还有底纹干扰;除了印刷字体,还会存在手写字体。同时,在扫描仪获取的图像中,往往会出现文档的倾斜现象;在相机、手机摄像头等移动、手持设备的拍摄中,由于拍摄角度问题,文档图像会出现一定的形变。为了更好的进行信息提取,包括文字识别,以及信息内容属性,有必要准确的定位出各个信息的位置,并进行一定的校正。以上情况,导致直接定位需要提取的信息位置存在很大难度。
现有的技术在识别时有许多采用磁条、RFID(射频识别Radio FrequencyIDentification)的方式,使用这种方式进行识别需要专有设备。且必须现场识别。而采用图像的技术,可以集中采集与识别分开进行;且摄像头在当前的手机、平板电脑等移动设备上很普遍,可以大大降低采集成本,增加采集便利性。在使用图像进行信息识别、提取的技术中,有许多是利用二维码、条形码进行识别。这种方式,需要进行专门的编码设置,且信息不直观、影响版面美观。不像直接的对文字信息进行识别的方式更直观方便,且许多已有的文档中可能并不具有条形码、二维码。还有一类技术是识别各种表格图像的。这种图像一方面多为扫描仪获取,不存在透视现象;一方面,表格通过表格线的对齐较容易定位各个信息,但是对于没有表格线的情况则无能为力。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种基于标准模版的文档图像的信息定位方法,为直接利用图像的识别提供定位方法,提高文档图像定位的适用性。
为实现上述目的,本发明采用的技术方案如下:
一种基于标准模版的文档图像的信息定位方法,包括以下步骤:
(1)将待处理图像进行预处理;所述预处理包括对灰度图像进行二值化处理得到二值化图像,以及对二值化图像进行连通域分析得到候选连通域;
(2)查找候选连通域中具有易识别特征的连通域群;
(3)根据所获取的具有易识别特征的连通域对灰度图像进行校正;所述校正包括倾斜校正和透视校正;
(4)根据易识别特征的连通域的位置和待处理图像的标准模版定位校正后图像中的待识别信息位置;所述标准模版是指将根据实际图像获取的待处理图像进行归一化处理后的图像。
进一步,如上所述的一种基于标准模版的文档图像的信息定位方法,步骤(1)中,所述待处理图像为根据实际图像获取的文档图像,如果待处理图像为彩色图像,图像预处理还包括将彩色图像转化为灰度图像。
进一步,如上所述的一种基于标准模版的文档图像的信息定位方法,步骤(2)中,所述的具有易识别特征的连通域群是指连通域最小外接矩形位置规律排列且尺寸相同的多个连通域、或者具有特定结构和特定颜色的图形的多个连通域,或者借助OCR引擎识别关键字及其组合的连通域;位置规律排列是指连通域最小外接矩形的中心点位于同一水平线上,且连通域最小外接矩形的宽度和高度相等。
进一步,如上所述的一种基于标准模版的文档图像的信息定位方法,在进行待处理图像的信息定位之前,首先获取待处理图像的标准模板,获取标准模板的具体方式为:
a.获取实际图像的实际宽、高和具有易识别特征的连通域的最小外接矩形的坐标,以及待识别信息的坐标;
b.根据实际图像获取能够被OCR识别的文档图像,确定文档图像的大小,计算图像的变换比例;所述文档图像的大小是指能够被OCR识别的文档图像的像素宽度或像素高度;图像的变换比例是指文档图像的像素宽度与实际图像的实际宽度的比值,或者是指文档图像的像素高度与实际图像的实际高度的比值;
c.根据图像变换比例,计算能够被OCR识别的文档图像的像素高度或像素宽度、具有易识别特征连通域的最小外接矩形的坐标,以及待识别信息的坐标,得到标准模版。
进一步,如上所述的一种基于标准模版的文档图像的信息定位方法,步骤(3)中,根据待处理图像的获取方式选取所要进行的校正方式,如果是扫描仪获取的图像,或者摄像头在正视角度下拍摄的图像使用倾斜校正;如果是摄像头大角度拍摄的图像,使用透视校正。
进一步,如上所述的一种基于标准模版的文档图像的信息定位方法,步骤(3)中,进行倾斜校正的具体方式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于方正国际软件(北京)有限公司;方正国际软件有限公司,未经方正国际软件(北京)有限公司;方正国际软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210477308.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:教育资产管理系统
- 下一篇:未成年人用防水喉镜叶片