[发明专利]一种基于标准模版的文档图像的信息定位方法无效

专利信息
申请号: 201210477308.6 申请日: 2012-11-21
公开(公告)号: CN103839058A 公开(公告)日: 2014-06-04
发明(设计)人: 胡希驰;史培培;杨镜 申请(专利权)人: 方正国际软件(北京)有限公司;方正国际软件有限公司
主分类号: G06K9/20 分类号: G06K9/20
代理公司: 北京天悦专利代理事务所(普通合伙) 11311 代理人: 田明;任晓航
地址: 100080 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 标准 模版 文档 图像 信息 定位 方法
【权利要求书】:

1.一种基于标准模版的文档图像的信息定位方法,包括以下步骤:

(1)将待处理图像进行预处理;所述预处理包括对灰度图像进行二值化处理得到二值化图像,以及对二值化图像进行连通域分析得到候选连通域;

(2)查找候选连通域中具有易识别特征的连通域群;

(3)根据所获取的具有易识别特征的连通域对灰度图像进行校正;所述校正包括倾斜校正和透视校正;

(4)根据具有易识别特征的连通域的位置和待处理图像的标准模版定位校正后图像中的待识别信息位置;所述标准模版是指将根据实际图像获取的待处理图像进行归一化处理后的图像。

2.如权利要求1所述的一种基于标准模版的文档图像的信息定位方法,其特征在于:步骤(1)中,所述待处理图像为根据实际图像获取的文档图像,如果待处理图像为彩色图像,图像预处理还包括将彩色图像转化为灰度图像。

3.如权利要求1所述的一种基于标准模版的文档图像的信息定位方法,其特征在于:步骤(2)中,所述的具有易识别特征的连通域群是指连通域最小外接矩形位置规律排列且尺寸相同的多个连通域、或者具有特定结构和特定颜色的图形的多个连通域,或者借助OCR引擎识别关键字及其组合的连通域;位置规律排列是指连通域最小外接矩形的中心点位于同一水平线上,且连通域最小外接矩形的宽度和高度相等。

4.如权利要求1所述的一种基于标准模版的文档图像的信息定位方法,其特征在于:在进行待处理图像的信息定位之前,首先获取待处理图像的标准模板,获取标准模板的具体方式为:

a.获取实际图像的实际宽、高和具有易识别特征的连通域的最小外接矩形的坐标,以及待识别信息的坐标;

b.根据实际图像获取能够被OCR识别的文档图像,确定文档图像的大小,计算图像的变换比例;所述文档图像的大小是指能够被OCR识别的文档图像的像素宽度或像素高度;图像的变换比例是指文档图像的像素宽度与实际图像的实际宽度的比值,或者是指文档图像的像素高度与实际图像的实际高度的比值;

c.根据图像变换比例,计算能够被OCR识别的文档图像的像素高度或像素宽度、具有易识别特征连通域的最小外接矩形的坐标,以及待识别信息的坐标,得到标准模版。

5.如权利要求1至4之一所述的一种基于标准模版的文档图像的信息定位方法,其特征在于:步骤(3)中,根据待处理图像的获取方式选取所要进行的校正方式,如果是扫描仪获取的图像,或者摄像头在正视角度下拍摄的图像使用倾斜校正;如果是摄像头大角度拍摄的图像,使用透视校正。

6.如权利要求5所述的一种基于标准模版的文档图像的信息定位方法,其特征在于:步骤(3)中,进行倾斜校正的具体方式为:

1)计算所有具有易识别特征的连通域的最小外接矩形中心点坐标;

2)将所有具有易识别特征的连通域的最小外接矩形中心点坐标作为hough变换的输入,根据hough变换算法计算灰度图像的倾斜角度;

3)按照倾斜角度将灰度图像转正。

7.如权利要求5所述的一种基于标准模版的文档图像的信息定位方法,其特征在于:步骤(3)中,进行透视校正的具体方式为:

①选择具有易识别特征的连通域中的任意四个连通域,计算四个连通域最小外接矩形的中心点坐标;所述四个连通域的最小外接矩形的中心点不位于同一条直线上;

②根据四个连通域最小外接矩形的中心点坐标和标准模板中对应的四个连通域最小外接矩形的中心点坐标,计算灰度图像的透视变换系数;

③根据透视变换系数,将有效区域内的灰度图像进行透视校正,得到校正后的灰度图像;所述有效区域是指包括有用信息的区域。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于方正国际软件(北京)有限公司;方正国际软件有限公司,未经方正国际软件(北京)有限公司;方正国际软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210477308.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top