[发明专利]报表提取方法、装置、存储介质及电子设备有效
申请号: | 201810918482.7 | 申请日: | 2018-08-13 |
公开(公告)号: | CN109359108B | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 吴擒龙 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/25 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 曾尧;魏嘉熹 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 报表 提取 方法 装置 存储 介质 电子设备 | ||
本公开涉及一种报表提取方法、装置、存储介质及电子设备,所述方法包括:根据预设的不同数据类型的数据库,对目标报表进行标记,得到所述目标报表的各个区域以及每一区域的数据类型标识,其中,所述目标报表为待提取的报表集合中的任一报表;以所述目标报表中具有不同数据类型标识的各个区域之间的相对位置关系为基准,将所述报表集合中其他报表与所述目标报表进行区域相对位置的比对,得到对比结果;根据所述比对结果从所述报表集合中提取出与所述目标报表的区域相对位置关系相匹配的报表。通过本公开的技术方案,相比于现有技术中通过人工标记每一张报表的不同数据类型区域来对各报表进行分类提取,可以提高效率和准确率。
技术领域
本公开涉及数据处理技术领域,具体地,涉及一种报表提取方法、装置、存储介质及电子设备。
背景技术
报表就是用表格、图标等格式来动态显示数据,其可以对事件进行初步统计的表格,形象地展示事件的相关信息。在日常工作中通常需要用到大量的报表,而每一张报表往往具有不同的类别,难以进行统一检索。
现有技术中,为了便于所有报表的统一检索,通常需要人工对每一张报表的主题、统计指标、单位和维度等不同数据类型的区域进行标记,根据各张报表的不同数据类型区域对报表进行分类提取,该方法效率低、准确率难以得到保证。
发明内容
为了克服现有技术中存在的问题,本公开提供一种报表提取方法、装置、存储介质及电子设备。
为了实现上述目的,本公开提供一种报表提取方法,包括:
根据预设的不同数据类型的数据库,对目标报表进行标记,得到所述目标报表的各个区域以及每一区域的数据类型标识,其中,所述目标报表为待提取的报表集合中的任一报表;
以所述目标报表中具有不同数据类型标识的各个区域之间的相对位置关系为基准,将所述报表集合中其他报表与所述目标报表进行区域相对位置的比对,得到比对结果;
根据所述比对结果从所述报表集合中提取出与所述目标报表的区域相对位置关系相匹配的报表。
可选地,所述根据预设的不同数据类型的数据库,对目标报表进行标记,得到所述目标报表的各个区域以及每一区域的数据类型标识,包括:
根据预设的不同数据类型的数据库,针对所述目标报表的每一区域,查询该区域的元素所属的数据库,并将该数据库预设的数据类型作为该区域的数据类型标识。
可选地,所述以所述目标报表中具有不同数据类型标识的各个区域之间的相对位置关系为基准,将所述报表集合中其他报表与所述目标报表进行区域相对位置的比对,包括:
按照所述目标报表的区域相对位置关系,对所述报表集合中其他任一报表进行区域依次划分,并且,在每划分得到一区域后,判断该区域与所述目标报表相同位置的区域是否属于相同的数据类型。
可选地,所述方法还包括:
若对所述任一报表新划分得到的区域与所述目标报表中相同位置的区域的数据类型不同,则停止对所述任一报表划分区域;
若对所述任一报表新划分得到的区域与该目标报表中相同位置的区域的数据类型相同,则继续对所述任一报表划分下一区域;
所述根据所述比对结果从所述报表集合中提取出与所述目标报表的区域相对位置关系相匹配的报表包括:
根据所述比对结果,从所述报表集合中提取出与所述目标报表区域相对位置关系相同的报表。
可选地,所述以所述目标报表中具有不同数据类型标识的各个区域之间的相对位置关系为基准,将所述报表集合中其他报表与所述目标报表进行区域相对位置的比对,包括:
按照所述目标报表的区域相对位置关系,对所述报表集合中其他任一报表进行区域划分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810918482.7/2.html,转载请声明来源钻瓜专利网。