[发明专利]一种宽表数据的生成方法、更新方法和相关装置在审
申请号: | 202010148063.7 | 申请日: | 2020-03-05 |
公开(公告)号: | CN113360494A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 吴帅 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/23;G06F16/2455 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李阳;郭晗 |
地址: | 100176 北京市北京经济技术*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 生成 方法 更新 相关 装置 | ||
本发明公开了一种宽表数据的生成方法、更新方法和相关装置,涉及计算机技术领域。该方法的一具体实施方式包括:根据维度非动态更新的数据表得到源表,根据维度动态更新的数据表得到维度数据表,按照配置的源表与汇总表之间的第一对应关系,根据源表的数据生成对应的汇总表,按照配置的汇总表、维度数据表的维度数据以及宽表之间的第二对应关系,根据汇总表和维度数据生成对应的宽表数据。该实施方式在更新已生成的宽表数据时,无需修改数据加工脚本且无需针对所有的主题表数据进行计算,克服任务重、成本高、风险大的缺陷,减少重复操作,大大减少了需重复计算的数据量,并且可以缩短整体计算时长,减少对服务器资源的浪费。
技术领域
本发明涉及计算机技术领域,尤其涉及一种宽表数据的生成方法、更新方法和相关装置。
背景技术
现今基于大数据平台数据加工,按照某些维度生成宽表数据进行归档。由于某些维度数据的变更,造成需要对历史归档数据的更新。现在常用的方式是修改数据加工脚本(即宽表数据生成脚本),比如修改不同的统计时间、分区等来对历史数据更新。修改数据加工脚本重跑数据,任务重、成本高、风险大,特别是对于变更频繁的统计维度数据,每一次数据变更都需要重复之前的操作。重跑历史数据追溯可能是几年前,重跑历史数据任务执行时间长,每修改一次数据加工脚本重启任务执行。每一次重跑数据,都需要针对所有的主题表(即用来生成宽表的数据表)数据进行计算,而各主题表是数据量非常的庞大,频繁地重跑历史数据,浪费服务器资源。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
现有的宽表数据生成和更新方案使得在某些维度数据的变更时,需要修改数据加工脚本来更新已生成的宽表数据,任务重、成本高、风险大,且需要针对所有的主题表数据进行计算,重复操作过多,重复计算的数据量庞大,整体计算时间长,且浪费服务器资源。
发明内容
有鉴于此,本发明实施例提供一种宽表数据的生成方法、更新方法和相关装置,在更新已生成的宽表数据时,无需修改数据加工脚本且无需针对所有的主题表数据进行计算,克服任务重、成本高、风险大的缺陷,减少重复操作,大大减少了需重复计算的数据量,并且可以缩短整体计算时长,减少对服务器资源的浪费。
为实现上述目的,根据本发明实施例的一个方面,提供了一种宽表数据的生成方法。
一种宽表数据的生成方法,包括:根据各数据表中维度非动态更新的数据表得到源表,根据所述各数据表中维度动态更新的数据表得到维度数据表;按照配置的源表与汇总表之间的第一对应关系,根据所述源表的数据生成对应的所述汇总表;按照配置的汇总表、维度数据表的维度数据以及宽表之间的第二对应关系,根据所述汇总表和所述维度数据表的维度数据生成对应的宽表数据。
可选地,还包括预先配置所述第一对应关系和所述第二对应关系,其中:配置所述第一对应关系包括:配置汇总表以及生成该汇总表所需的各源表、所述各源表需抽取的字段、维度数据主键;配置所述第二对应关系包括:配置宽表以及生成该宽表所需的各汇总表、所述各汇总表需抽取的字段、所述各汇总表对应的所述维度数据主键。
可选地,所述源表的数据动态增加,所述汇总表包括一个或多个分区表;所述按照配置的源表与汇总表之间的第一对应关系,根据所述源表的数据生成对应的所述汇总表,包括:按照配置的所述各源表需抽取的字段,周期性地从所述各源表的新增数据中抽取数据,其中每一周期根据从所述新增数据中抽取的数据计算生成所述汇总表的一个分区表。
可选地,配置所述第二对应关系还包括配置所述各汇总表的动态分区信息;所述按照配置的汇总表、维度数据表的维度数据以及宽表之间的第二对应关系,根据所述汇总表和所述维度数据表的维度数据生成对应的宽表数据,包括:根据配置的所述动态分区信息,确定所述各汇总表需要使用的分区表;按照配置的所述各汇总表需抽取的字段,从所述各汇总表需要使用的分区表中抽取数据,按照所述维度数据表中的维度数据,对从各分区表中抽取的数据进行汇总,以生成对应的宽表数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010148063.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种销齿传动中销齿轮的齿廓
- 下一篇:一种显示面板及其制备方法、显示装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置