[发明专利]表格类图像的信息识别方法、电子装置及可读存储介质有效

专利信息
申请号: 201711240787.9 申请日: 2017-11-30
公开(公告)号: CN107862303B 公开(公告)日: 2019-04-26
发明(设计)人: 王健宗;王威;刘鹏;肖京 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/32
代理公司: 深圳市沃德知识产权代理事务所(普通合伙) 44347 代理人: 高杰;于志光
地址: 518000 广东省深*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 表格 图像 信息 识别 方法 电子 装置 可读 存储 介质
【权利要求书】:

1.一种电子装置,其特征在于,所述电子装置包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的表格类图像的信息识别系统,所述表格类图像的信息识别系统被所述处理器执行时实现如下步骤:

A、在收到待处理的表格类图像后,识别所述表格类图像的表格类别,并根据预先确定的表格类别与标准模板的映射关系,确定出与所述表格类图像的表格类别对应的第一标准模板及第二标准模板;其中,所述第一标准模板中预先设置有文本行位置标注框,所述第二标准模板中预先设置有关键信息位置标注框;

B、利用预先确定的校正规则对所述表格类图像进行角度校正,使用预先训练的文本行检测模型检测出角度校正后的表格类图像上的所有文本行,并将检测出的文本行与所述第一标准模板中的文本行位置进行比对,确定所述第一标准模板到角度校正后的表格类图像的位置对应关系;

C、根据所述位置对应关系,将所述第二标准模板上的关键信息位置标注框映射到角度校正后的表格类图像上,得到角度校正后的表格类图像上的关键信息位置,并利用预先确定的字符识别模型识别出角度校正后的表格类图像上的关键信息。

2.如权利要求1所述的电子装置,其特征在于,所述预先确定的校正规则为:

预先设定一最大旋转角度max_skew及旋转次数n,从-max_skew到max_skew平均分成n份,得到一列备选的旋转角度;

以灰度图的方式读入所述表格类图像,对于每一个备选的旋转角度,将灰度图按照该备选的旋转角度大小进行旋转得到新图像矩阵,把得到的新图像矩阵每行所有像素点的像素值求均值以得到一列均值,将得到的一列均值求方差,依此计算,每一个备选的旋转角度对应一个方差值;

从所有备选的旋转角度对应的方差值中挑选出最大方差值,将该最大方差值对应的备选的旋转角度作为校正角度,并利用所述校正角度对所述表格类图像进行校正。

3.如权利要求1或2所述的电子装置,其特征在于,所述文本行检测模型为联结文本提案网络CTPN模型,该联结文本提案网络CTPN模型用于检测出角度校正后的表格类图像中文本行的位置,并用标注框标注出检测出的文本行的位置。

4.如权利要求3所述的电子装置,其特征在于,所述将检测出的文本行与所述第一标准模板中的文本行位置进行比对,确定所述第一标准模板到角度校正后的表格类图像的位置对应关系包括:

D1、对所述第一标准模板中的所有标注框和检测出的表格类图像中的所有标注框分别进行分组;在分组时,若所述第一标准模板或表格类图像中两个标注框左上角的纵坐标差值的绝对值小于预设值,则将该两个标注框分为一组,以使得处于同一组的标注框都位于同一行;

D2、对分组后的每一行标注框按照行内每个标注框左上角横坐标从小到大的顺序进行标注框排序;

D3、对所有行按照每行第一个标注框左上角的纵坐标从小到大的顺序进行行排序;

D4、若所述第一标准模板中有m行标注框,则从该表格类图像的标注框行排序中选出m行标注框,让从该表格类图像中选出的m行标注框按照行号从小到大的顺序依次与所述第一标准模板中的m行标注框对应,形成m对标注框行;

D5、逐一从m对标注框行中选择配对的标注框行,在一对标注框行被选择后,若该对标注框行中第一标准模板对应的行有n个标注框,则分别从该表格类图像对应的行中取出p个标注框,直到无法选择出不同的p个标注框,其中,m、n、p为正整数,p≤n;在每次选择出p个标注框后,让该p个标注框依次与所述第一标准模板对应的行的n个标注框中的p个标注框对应,得到p对标注框;根据该p对标注框中每对标注框对应的位置框差值,并按预设规则计算得到选择的该对标注框行的位置行差值;

D6、在m对标注框行选择完毕后,得到m个位置行差值,根据m个位置行差值确定出所述第一标准模板到角度校正后的表格类图像的位置对应关系。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711240787.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top