[发明专利]一种基于弧微分的图像中畸变表格校正系统及其校正方法在审

专利信息
申请号: 202210513521.1 申请日: 2022-05-12
公开(公告)号: CN115082939A 公开(公告)日: 2022-09-20
发明(设计)人: 张巍元;王振鑫;裴昀;岳驰涛;李振强 申请(专利权)人: 吉林省吉林祥云信息技术有限公司
主分类号: G06V30/412 分类号: G06V30/412;G06V30/414;G06V30/146;G06V30/16;G06V30/162
代理公司: 哈尔滨市阳光惠远知识产权代理有限公司 23211 代理人: 姜艳红
地址: 130000 吉林省长春市*** 国省代码: 吉林;22
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 微分 图像 畸变 表格 校正 系统 及其 方法
【说明书】:

发明是一种基于弧微分的图像中畸变表格校正系统及其校正方法。本发明涉及图像处理,图像文字校正技术领域,本发明对表格图像进行二值化处理,再提取表格线,并拟合表格线函数,之后根据弧微分校正表格线,最后根据相邻表格线校正文字。本发明根据弧微分校正表格,既适用于文档图像中表格倾斜的场景,又适用于表格线弯曲的场景。从而能够将表格校正到一个较为理想的状态,进而有利于提高表格结构分析和内容识别的准确性。

技术领域

本发明涉及图像处理,图像文字校正技术领域,是一种基于弧微分的图像中畸变表格校正系统及其校正方法。

背景技术

通过高拍仪等相机拍摄的方式对纸质文档进行采集的过程中,由于纸质文档放置方向倾斜、或本身不平整,从而导致采集的图像中表格线呈倾斜弯曲的状态,文字呈倾斜畸变状态。这会严重影响OCR识别的准确度。为了提高识别的准确度,需对采集的表格图像进行校正。已有技术用于表格图像的校正,如通过游程分析检测表格图像中最长的游程,将该游程的倾斜角度作为倾斜矫正的依据。类似的,通过Hough变换检测图像中的直线,再根据倾角进行全局的旋转调整。投影法也可实现倾斜校正,设定旋转间隔后对图像进行多个角度的旋转,每次旋转后计算其水平方向和垂直方向投影的标准差,标准差取得最大时对应的旋转角度为表格的倾斜角度。此外,基于文本行最小外接矩形的方式,首先通过形态学的操作合并文字为行单位,从而得到每一文本行的最小外接矩形,外接矩形的倾斜角度即为文本行的倾斜角度。此类方法的不足在于仅适用于图像采集时,由于纸质文档在水平方向上发生倾斜而产生的图像内表格倾斜校正,不适用于文档发生弯曲畸变导致的图像中表格线畸变的校正。

发明内容

本发明为克服现有技术的不足,本发明目的是提供基于弧微分的图像中畸变表格校正方法。用以改善现有技术对于图像中畸变表格校正能力的不足。本发明提供了一种基于弧微分的图像中畸变表格校正系统及其校正方法,本发明提供了以下技术方案:

一种基于弧微分的图像中畸变表格校正方法,所述方法包括以下步骤:

步骤1:对表格图像进行二值化处理,确定背景和表格文字;

步骤2:对二值化后的图像进行表格线提取,提取处表格线;

步骤3:建立拟合表格线函数,拟合表格线;

步骤4:根据拟合后的表格线,进行表格线校正;

步骤5:根据校正后的表格线,对图像中表格文字进行校正。

优选地,所述步骤1具体为:

通过大津法对图像进行全局的二值化处理,属于背景的像素值为255,属于表格、文字等像素的像素值为0。

优选地,所述步骤2具体为:

步骤2.1:进行表格线候选,将对应的x方向和y方向坐标之和最小的非背景点作为起始点,开始遍历其他非背景点;

步骤2.3:当其他非背景点与该点存在邻接关系,则构成候选表格线游程,继续遍历其他非背景点,当其他非背景点与游程邻接,则对游程进行拓展,直到没有进行合并的点;再从未被合并的非背景点中,按照同样的方式选择起始点后重复上述过程;

步骤2.3:进行表格线筛选,根据长度筛选候选表格线,过滤长度较短的候选表格线,只保留长度高于设定阈值的表格线。

优选地,所述步骤3具体为:

对表格线进行函数拟合,根据构成表格线的所有点的坐标信息拟合表格线的函数,记为f1,f2,…,fm

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林省吉林祥云信息技术有限公司,未经吉林省吉林祥云信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210513521.1/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top