[发明专利]一种表格指标提取方法及装置在审
申请号: | 202211430047.2 | 申请日: | 2022-11-15 |
公开(公告)号: | CN115687425A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 梅诗妍;侯凯;李佳;孙罡;陈铭;刘江敏;刘刚刚;胡晋岚;刘景华;姜玉梁;周妍;秦燕;秦万祥;赵芳菲 | 申请(专利权)人: | 广东电网有限责任公司 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/2458 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 陈旭红 |
地址: | 510000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 表格 指标 提取 方法 装置 | ||
本发明公开了一种表格指标提取方法及装置。所述表格指标提取方法,包括:从待处理表格中解析出若干个子表格的表名和每一所述子表格中的若干个列名;结合所有所述子表格的表名和所有所述子表格中的所有列名进行规则配置,得到目标指标的规则表;根据所述目标指标的规则表,从所述待处理表格中提取所述目标指标。本发明能够适应不同格式的待处理表格灵活配置目标指标的规则表,基于目标指标的规则表自动提取目标指标。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种表格指标提取方法及装置。
背景技术
在工程审核或者评估工程投资合理性的时候,往往会采用人工或利用系统提供的表格指标提取功能从工程造价报表中提取出关键的指标进行评估。采用人工提取表格指标虽然具有灵活性,但提取效率较低人力成本较高。而利用系统提供的指标提取功能提取表格指标则要求预先在系统中针对统一格式的表格固定化设置表格指标提取规则,一般是选择EXCEL表格中固定单元格数据定义指标,以根据EXCEL表格中固定单元格数据提取表格指标,使得表格指标提取规则缺乏灵活性,且随着行业对工程造价报表中产品命名等规定的修订,原有的表格指标提取规则将不再适应新修订格式的表格发生失效,需要重新开发系统的指标提取功能以适应新修订格式的表格。可见,现有的表格指标提取方法并不能适应不同格式的表格灵活配置表格指标提取规则,基于表格指标提取规则自动提取表格指标。
发明内容
为了克服现有技术的缺陷,本发明提供一种表格指标提取方法及装置,能够适应不同格式的待处理表格灵活配置目标指标的规则表,基于目标指标的规则表自动提取目标指标。
为了解决上述技术问题,第一方面,本发明一实施例提供一种表格指标提取方法,包括:
从待处理表格中解析出若干个子表格的表名和每一所述子表格中的若干个列名;
结合所有所述子表格的表名和所有所述子表格中的所有列名进行规则配置,得到目标指标的规则表;
根据所述目标指标的规则表,从所述待处理表格中提取所述目标指标。
进一步地,在所述从待处理表格中解析出若干个子表格的表名和每一所述子表格中的若干个列名之后,还包括:
采用自动学习技术识别各个所述子表格的表名对应的标准表名,以及各个所述子表格中的每一列名对应的标准列名;
将各个所述子表格的表名转换为对应的标准表名,分别将各个所述子表格中的每一列名转换为对应的标准列名。
进一步地,所述结合所有所述子表格的表名和所有所述子表格中的所有列名进行规则配置,得到目标指标的规则表,具体为:
基于所有所述子表格的表名和所有所述子表格中的所有列名,根据用户针对所述目标指标输入的若干组规则配置参数,从所有所述子表格中确定若干个目标子表格和每一所述目标子表格的搜索列范围,生成若干条表格指标提取规则,以整合所有所述表格指标提取规则,得到所述目标指标的规则表。
进一步地,所述规则配置参数包括数据来源表的表名、列范围、列范围开始关键字、列范围结束关键字、查找列、结果列、匹配类型、搜索关键字、匹配模式、规则叠加模式、比例换算方式。
进一步地,所述根据所述目标指标的规则表,从所述待处理表格中提取所述目标指标,具体为:
分别根据所述目标指标的规则表中的每一所述表格指标提取规则,从待处理表格中提取对应的目标数据,得到所有所述目标数据,并结合所有所述目标数据,计算所述目标指标。
第二方面,本发明一实施例提供一种表格指标提取装置,包括:
表格解析模块,用于从待处理表格中解析出若干个子表格的表名和每一所述子表格中的若干个列名;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司,未经广东电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211430047.2/2.html,转载请声明来源钻瓜专利网。