[发明专利]一种基于区域生长的表格框线检测方法在审
申请号: | 201811428101.3 | 申请日: | 2018-11-27 |
公开(公告)号: | CN109800625A | 公开(公告)日: | 2019-05-24 |
发明(设计)人: | 周康明 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 上海尚象专利代理有限公司 31335 | 代理人: | 徐炫 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 二值化处理 表格框线 区域生长 图片 游程 褶皱 服务器下载 图像预处理 表格单据 规则区域 后期处理 图像倾斜 校正处理 有效检测 鲁棒性 自适应 检测 外框 筛选 生长 清晰 | ||
本发明公开了一种基于区域生长的表格框线检测方法,包括:从服务器下载表格图片;对所述表格图片进行图像倾斜校正处理;对所述表格图片进行图像预处理;对所述表格图片进行自适应二值化处理;在所述表格图片的二值化处理图上面,确定直线的起始游程段;对每一段游程段按照一定的规则区域生长出整个直线的方向;对所述表格图片进行后期处理,包括直线的连接和筛选。本发明能够对表格外框进行有效检测,并能够对表格单据褶皱、不清晰等干扰保持较好的鲁棒性。
技术领域
本发明涉及表格单据电子化技术领域,特别涉及一种基于区域生长的表格框线检测方法。
背景技术
当前,表格单据的数据分析基本上还是基于人工阅读审核的方式,效率低,无法实现审批自动化。银行的信审部分,传统的人工审核方式已经严重阻碍了银行信审的效率和业务开展。其实,信审的依据是表格单据上的核心数据,只要提高表格单据数据的采集工作,银行信审的效率就会大幅提高,表格单据电子化帮助银行、税务、审计等提高效率,构建自动化的信审系统。如何准确、快速地对表格单据报表电子化,同时避免人工核对成本高,易疲劳,易疏忽等弊端,是急需解决的技术问题。
然而,现有的表格自动技术,在表格的自动识别过程中,检测表格框线及其重要,检测结果直接关乎计算机对表格的正确识别。但是在实际操作过程中表格图片质量差,表格框线出现断裂、倾斜和模糊等情况,极大的干扰了表格框线的检测。
发明内容
针对上述现有技术中存在的问题,本发明的目的是:提出一种基于区域生长的表格框线检测方法,其能够对表格外框进行有效检测,并能够对表格单据褶皱、不清晰等干扰保持较好的鲁棒性。
本发明解决其技术问题所采用的技术方案是:
一种基于区域生长的表格框线检测方法,包括:
S1、从服务器下载表格图片;
S2、对所述表格图片进行图像倾斜校正处理;
S3、对所述表格图片进行图像预处理;
S4、对所述表格图片进行自适应二值化处理;
S5、在所述表格图片的二值化处理图上面,确定直线的起始游程段;
S6、对每一段游程段按照一定的规则区域生长出整个直线的方向;
S7、对所述表格图片进行后期处理,包括直线的连接和筛选。
进一步,所述图像倾斜校正处理的步骤如下:
S2-1、为减少查找直线的计算量,运用canny边缘检测算法对所述表格图片进行边缘检测,获得边缘检测图;
S2-2、运用hough变换在边缘检测图上检测直线;
S2-3、筛选符合条件的直线,并记录其倾斜角度;
S2-4、采用投票机制确定票数最多的倾斜角度为图像的倾斜角度;
S2-5、利用仿射变换对图像旋转。
进一步,所述图像预处理的步骤如下:
S3-1、对图像进行图像灰度化处理;
S3-2、对图像进行基于伽马变换的图像增强处理;
S3-3、在获得横线之前,用水平核函数对图像进行高斯滤波,增强图像水平方向上关联性。
进一步,所述自适应二值化处理的步骤如下:
S4-1、采用图像膨胀腐蚀操作的方法查找轮廓,并获得轮廓图;
S4-2、采用投票思想,将获得最多的轮廓矩形高度设定为表格内容字符的高度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811428101.3/2.html,转载请声明来源钻瓜专利网。