[发明专利]一种数据表处理方法、装置、设备及介质在审
申请号: | 201811623238.4 | 申请日: | 2018-12-28 |
公开(公告)号: | CN109710702A | 公开(公告)日: | 2019-05-03 |
发明(设计)人: | 王朝庆;陈宏仁;姜巍;张帆;刘勇 | 申请(专利权)人: | 税友软件集团股份有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/25 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 310053 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标数据项 数据表处理 数据分析 数据内容 读取 计算设备 数据表设置 获取数据 数据集市 资源开销 数据项 预设 写入 | ||
本发明公开了一种数据表处理方法、装置、设备及介质。该方法的步骤包括:获取数据集市中的原始数据表;在原始数据表中提取目标数据项的数据内容,并将数据内容写入至预设的新数据表;其中,目标数据项为执行数据分析操作所需的数据项,新数据表的结构中包含有目标数据项;将新数据表设置为执行数据分析操作时读取的数据表。本方法相对减少了对数据集市中的数据表进行数据分析时计算设备需要读取的数据内容总量,进而相对减少了计算设备的资源开销。此外,本发明还提供一种数据表处理装置、设备及介质,有益效果同上所述。
技术领域
本发明涉及数据处理领域,特别是涉及一种数据表处理方法、装置、设备及介质。
背景技术
数据集市(Data Mart),也称数据市场,数据集市是满足特定的部门或用户的需求,按照包括定义维度、需要计算的指标、维度层次等多维的方式进行存储的数据库。
从范围上来说,数据集市中的数据是从企业范围的数据库、数据仓库,或者是更加专业的数据仓库中抽取出来的,并且数据集市以数据表的形式对所存储的数据进行承载,对于不同类型业务的数据而言,其对应的数据表结构也有所差异。由于数据集市中的数据内容相对繁杂,因此数据集市中的各类数据表的数据项也相对较多。在实际使用中,由于企业往往仅需要使用数据集市中所获取的数据表中固定的某几项数据内容进行数据分析,这就导致在每次进行数据内容的分析时,均需要计算设备对数据表中的数据内容进行全面的读取,以此进一步提取出企业需要的目标数据项的数据内容进行后续的分析操作,因此当前企业对数据集市中获取的数据表进行数据分析时所造成的设备资源开销相对较高。
由此可见,提供一种数据表处理方法,以相对减少对数据集市中的数据表进行数据分析时需要造成的设备资源开销,是本领域技术人员需要解决的问题。
发明内容
本发明的目的是提供一种数据表处理方法、装置、设备及介质,以相对减少对数据集市中的数据表进行数据分析时需要造成的设备资源开销。
为解决上述技术问题,本发明提供一种数据表处理方法,包括:
获取数据集市中的原始数据表;
在原始数据表中提取目标数据项的数据内容,并将数据内容写入至预设的新数据表;其中,目标数据项为执行数据分析操作所需的数据项,新数据表的结构中包含有目标数据项;
将新数据表设置为执行数据分析操作时读取的数据表。
优选的,该方法进一步包括:
当接收到数据更新指令时,计算新数据表中待更新数据项的目标原始数据内容与对应的新数据内容之间的差异数据内容;
将差异数据内容插入至新数据表,并建立差异数据内容与目标原始数据内容之间的对应关系。
优选的,新数据表中的各目标数据项的名称为空值。
优选的,原始数据表的数量大于1。
优选的,在将数据内容写入至预设的新数据表后,该方法进一步包括:
将新数据表存储至分布式文件系统。
此外,本发明还提供一种数据表处理装置,包括:
原始表获取模块,用于获取数据集市中的原始数据表;
新表写入模块,用于在原始数据表中提取目标数据项的数据内容,并将数据内容写入至预设的新数据表;其中,目标数据项为执行数据分析操作所需的数据项,新数据表的结构中包含有目标数据项;
新表设置模块,用于将新数据表设置为执行数据分析操作时读取的数据表。
此外,本发明还提供一种数据表处理设备,包括:
存储器,用于存储计算机程序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于税友软件集团股份有限公司,未经税友软件集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811623238.4/2.html,转载请声明来源钻瓜专利网。