[发明专利]表格重建方法、装置、电子设备及存储介质在审
申请号: | 201910988791.6 | 申请日: | 2019-10-17 |
公开(公告)号: | CN110738030A | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 周康明;王庆峰 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G06F40/183 | 分类号: | G06F40/183;G06F40/18;G06F40/177 |
代理公司: | 31219 上海光华专利事务所(普通合伙) | 代理人: | 庞红芳 |
地址: | 200032 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表格图像 字符串位置 表格区域 二值化图像 字符串 列数 行数 重构 重建 预处理 报表表格 存储介质 电子设备 阈值获取 二值化 构建 填入 预设 检测 财务 申请 | ||
本申请提供表格重建方法、装置、电子设备及存储介质,所述表格重建方法包括:获取待处理表格图像并对获取的所述待处理表格图像进行预处理,形成初始表格图像;获取所述初始表格图像中的字符高度,并根据所述字符高度和预设的二值化阈值获取所述初始表格图像对应的二值化图像;检测所述初始表格图像中的表格区域并定位所述表格区域中的字符串位置;根据所述表格区域、所述字符串位置以及所述二值化图像确定表格的行数和列数,并构建对应行数、列数的重构表格;根据所述字符串位置识别所述初始表格图像中的对应字符串,并将识别的所述字符串填入对应的所述重构表格。本发明实现了财务报表表格的重建及识别。
技术领域
本申请涉及自动化技术领域,特别是涉及文本处理自动化技术领域,具体为一种表格重建方法、装置、电子设备及存储介质。
背景技术
随着社会经济的发展和中国城镇化的推进,越来越多的人进入城市就业,越来越多的公司诞生;同时随着互联网技术的发展,电子交易,数字交易已经普及;对于公司、银行、证卷交易产生越来越多的财务表格单据及信息。传统的财务报行;速度慢、效率底,很难满足越来越多的表格单据信息的识别、入库及自动校对。
在国家智慧金融及人工智能相关政策的指引下,越来越多的金融机构和科技公司开始针对财务表格单据进行相应的投入和研究。而其中有些情况需要针对财务表格单据进行表格重建,但是有一些财务单据存在无表格,表无框线、虚线框、表格线质量较差情况下,这为表格重建及识别带来很大困难。如何快速的根据现有财务单据重构相应的财务表格成为本领域技术人员亟待解决的技术问题。
申请内容
鉴于以上所述现有技术的缺点,本申请的目的在于提供表格重建方法、装置、电子设备及存储介质,用于解决现有技术中无法有效进行无框线、虚线框、表格线质量较差情况下的表格重建及识别的技术问题。
为实现上述目的及其他相关目的,本申请的第一方面提供一种表格重建方法,包括:获取待处理表格图像并对获取的所述待处理表格图像进行预处理,形成初始表格图像;获取所述初始表格图像中的字符高度,并根据所述字符高度和预设的二值化阈值获取所述初始表格图像对应的二值化图像;检测所述初始表格图像中的表格区域并定位所述表格区域中的字符串位置;根据所述表格区域、所述字符串位置以及所述二值化图像确定表格的行数和列数,并构建对应行数、列数的重构表格;根据所述字符串位置识别所述初始表格图像中的对应字符串,并将识别的所述字符串填入对应的所述重构表格。
于本申请的第一方面的一些实施例中,所述获取所述初始表格图像中的字符高度的一种实现方式包括:对所述初始表格图像进行自适应二值化处理形成第一图像;获取所述第一图像中的字符连通区域,并计算所述字符连通区域中的字符高度;根据所述初始表格图像的缩放比例和所述字符连通区域中的字符高度确定所述初始表格图像中的字符高度。
于本申请的第一方面的一些实施例中,所述表格重建方法还包括:根据获取的所述初始表格图像中的字符高度和预设高度阈值判断所述初始表格图像是否可以缩放,若是,则将所述初始表格图像进行缩放,形成缩放图像。
于本申请的第一方面的一些实施例中,所述表格重建方法还包括:根据红章特征和表格线灰度图特征识别并去除所述缩放图像中的红章,生成去章图像;对所述去章图像进行灰度变换,生成单通道图像。
于本申请的第一方面的一些实施例中,所述根据所述字符高度和预设的二值化阈值获取所述初始表格图像对应的二值化图像的一种实现方式包括:根据所述字符高度构造匹配的水平结构元素和竖直结构元素;根据构造的所述水平结构元素和所述竖直结构元素对所述单通道图像进行卷积处理以增强所述单通道图像中的表格线;根据所述字符高度设置自适应二值化函数的核尺寸;根据二值化函数和预设的二值化阈值获取所述单通道图像的二值化图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910988791.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:复合材料铺层数据导入方法
- 下一篇:读书笔记的生成方法、装置及设备