[发明专利]表格类图像的信息识别方法、电子装置及可读存储介质有效
申请号: | 201711240787.9 | 申请日: | 2017-11-30 |
公开(公告)号: | CN107862303B | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 王健宗;王威;刘鹏;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表格 图像 信息 识别 方法 电子 装置 可读 存储 介质 | ||
1.一种电子装置,其特征在于,所述电子装置包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的表格类图像的信息识别系统,所述表格类图像的信息识别系统被所述处理器执行时实现如下步骤:
A、在收到待处理的表格类图像后,识别所述表格类图像的表格类别,并根据预先确定的表格类别与标准模板的映射关系,确定出与所述表格类图像的表格类别对应的第一标准模板及第二标准模板;其中,所述第一标准模板中预先设置有文本行位置标注框,所述第二标准模板中预先设置有关键信息位置标注框;
B、利用预先确定的校正规则对所述表格类图像进行角度校正,使用预先训练的文本行检测模型检测出角度校正后的表格类图像上的所有文本行,并将检测出的文本行与所述第一标准模板中的文本行位置进行比对,确定所述第一标准模板到角度校正后的表格类图像的位置对应关系;
C、根据所述位置对应关系,将所述第二标准模板上的关键信息位置标注框映射到角度校正后的表格类图像上,得到角度校正后的表格类图像上的关键信息位置,并利用预先确定的字符识别模型识别出角度校正后的表格类图像上的关键信息。
2.如权利要求1所述的电子装置,其特征在于,所述预先确定的校正规则为:
预先设定一最大旋转角度max_skew及旋转次数n,从-max_skew到max_skew平均分成n份,得到一列备选的旋转角度;
以灰度图的方式读入所述表格类图像,对于每一个备选的旋转角度,将灰度图按照该备选的旋转角度大小进行旋转得到新图像矩阵,把得到的新图像矩阵每行所有像素点的像素值求均值以得到一列均值,将得到的一列均值求方差,依此计算,每一个备选的旋转角度对应一个方差值;
从所有备选的旋转角度对应的方差值中挑选出最大方差值,将该最大方差值对应的备选的旋转角度作为校正角度,并利用所述校正角度对所述表格类图像进行校正。
3.如权利要求1或2所述的电子装置,其特征在于,所述文本行检测模型为联结文本提案网络CTPN模型,该联结文本提案网络CTPN模型用于检测出角度校正后的表格类图像中文本行的位置,并用标注框标注出检测出的文本行的位置。
4.如权利要求3所述的电子装置,其特征在于,所述将检测出的文本行与所述第一标准模板中的文本行位置进行比对,确定所述第一标准模板到角度校正后的表格类图像的位置对应关系包括:
D1、对所述第一标准模板中的所有标注框和检测出的表格类图像中的所有标注框分别进行分组;在分组时,若所述第一标准模板或表格类图像中两个标注框左上角的纵坐标差值的绝对值小于预设值,则将该两个标注框分为一组,以使得处于同一组的标注框都位于同一行;
D2、对分组后的每一行标注框按照行内每个标注框左上角横坐标从小到大的顺序进行标注框排序;
D3、对所有行按照每行第一个标注框左上角的纵坐标从小到大的顺序进行行排序;
D4、若所述第一标准模板中有m行标注框,则从该表格类图像的标注框行排序中选出m行标注框,让从该表格类图像中选出的m行标注框按照行号从小到大的顺序依次与所述第一标准模板中的m行标注框对应,形成m对标注框行;
D5、逐一从m对标注框行中选择配对的标注框行,在一对标注框行被选择后,若该对标注框行中第一标准模板对应的行有n个标注框,则分别从该表格类图像对应的行中取出p个标注框,直到无法选择出不同的p个标注框,其中,m、n、p为正整数,p≤n;在每次选择出p个标注框后,让该p个标注框依次与所述第一标准模板对应的行的n个标注框中的p个标注框对应,得到p对标注框;根据该p对标注框中每对标注框对应的位置框差值,并按预设规则计算得到选择的该对标注框行的位置行差值;
D6、在m对标注框行选择完毕后,得到m个位置行差值,根据m个位置行差值确定出所述第一标准模板到角度校正后的表格类图像的位置对应关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711240787.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于半监督学习的人体运动检测系统及方法
- 下一篇:眼部状态的判断方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置