[发明专利]去除颜色边框的表格裁切方法、图像处理设备和存储介质有效

专利信息
申请号: 202010225353.7 申请日: 2020-03-26
公开(公告)号: CN111414877B 公开(公告)日: 2023-06-20
发明(设计)人: 李佳;杨阳;刘旭东 申请(专利权)人: 遥相科技发展(北京)有限公司
主分类号: G06V30/412 分类号: G06V30/412;G06V30/414;G06V30/148;G06V30/18
代理公司: 佛山粤进知识产权代理事务所(普通合伙) 44463 代理人: 王储
地址: 100000 北京市海淀区学*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 去除 颜色 边框 表格 方法 图像 处理 设备 存储 介质
【说明书】:

发明公开了一种去除颜色边框的表格裁切方法,包括:获取待处理的图像,待处理的图像包括待提取文字,待提取文字处于至少一个边框中,至少部分至少一个边框的颜色不相同;计算待处理图像的每个像素的色调饱和值,生成色调饱和图像;提取色调饱和图像中对应至少一个边框的至少一个边框色调饱和值;对至少边框色调饱和值进行中值滤波,保留对应最外围边框的最外色调饱和值,生成单边框图像;对单边框图像进行边缘检测,获取二值图像;对二值图像进行轮廓检测,并根据检测结果对单边框图像进行裁切,获取裁切图像;将裁切图像中的最外围边框的颜色替换为白色,生成提取图像。通过上述方式,本发明能够有效提升工作效率,图像处理设备和存储介质。

技术领域

本发明涉及领图像处理域,特别是涉及去除颜色边框的表格裁切方法、图像处理设备和存储介质。

背景技术

对于OCR(Optical Character Recognition,光学字符识别)表格文字提取中,有一种情况是文字图片里带有颜色表格。对于表格的裁切需要做边框过滤、边缘检测、轮廓检测和裁切这些步骤,然后才能准确提取表格框,为下一步文字识别准备。

目前针对颜色边框的表格裁切的应用中,对于不同颜色的边框,都是根据具体颜色,手动设置过滤条件,去除颜色,这样会每次修改内部参数,无法实现自动化处理,这样会产生工作效率低下。

发明内容

本发明主要解决的技术问题是提供去除颜色边框的表格裁切方法、图像处理设备和存储介质,能够实现对去除颜色边框的表格进行自动裁切,有效提升工作效率。

为解决上述技术问题,本发明采用的一个技术方案是:提供一种获取待处理的图像,所述待处理的图像包括待提取文字,所述待提取图文字处于至少一个边框中,至少部分所述至少一个边框的颜色不相同;计算所述待处理图像的每个像素的色调饱和值,生成色调饱和图像;提取所述色调饱和图像中对应所述至少一个边框的至少一个边框色调饱和值;对所述至少边框色调饱和值进行中值滤波,保留对应最外围边框的最外色调饱和值,生成单边框图像;对所述单边框图像进行边缘检测,获取二值图像;对所述二值图像进行轮廓检测,并根据检测结果对所述单边框图像进行裁切,获取裁切图像;将所述裁切图像中的所述最外围边框的颜色替换为白色,生成提取图像。

其中,所述提取所述色调饱和图像中对应所述至少一个边框的至少一个边框色调饱和值的步骤之后,包括:获取所述至少一个边框色调饱和值的最低值和最高值,根据所述最高值和所述最低值获取所述至少一个边框的对应区域。

其中,所述对所述单边框图像进行边缘检测的步骤,包括:采用高斯滤波器对所述单边框图像进行滤波,获取滤波图像;计算所述滤波图像每个像素点的梯度大小和梯度方向;对所述滤波图像进行非极大值抑制,获取抑制图像;采用双阈值法确定所述抑制图像的边缘。

其中,所述双阈值法中的最大阈值和最小阈值之差大于100。

其中,所述对所述单边框图像进行边缘检测的步骤之后,包括:根据所述最外围边框的宽度和所述最外围边框的行数获取最短线长;在所述边缘检测的图像结果上采用统计概率霍夫直线变换,所述统计概率霍夫直线变换的直线最短长度为所述最短线长。

其中,所述对所述二值图像进行轮廓检测的步骤之后,包括:压缩所述轮廓检测的结果水平方向、垂直方向和对角线方向的像素,仅保留水平方向、垂直方向和对角线方向的终点坐标。

其中,所述根据检测结果对所述单边框图像进行裁切的步骤,包括:从所述单边框图像的行和列的中心点开始,向左和向右各取等距离的正方形进行裁切。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于遥相科技发展(北京)有限公司,未经遥相科技发展(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010225353.7/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top