[发明专利]一种多维度拆分的计算方法以及系统有效
申请号: | 201310381567.3 | 申请日: | 2013-08-28 |
公开(公告)号: | CN104424251B | 公开(公告)日: | 2019-03-15 |
发明(设计)人: | 蔡馥晗;李浩;武磊;曾伟纪 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 蒋雅洁;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多维 拆分 计算方法 以及 系统 | ||
1.一种多维度拆分的计算方法,其特征在于,包括:
根据预处理后的海量预处理数据,生成递推拓扑,所述递推拓扑由维度组合以及各维度组合之间的递推路径构成,所述维度组合由各维度的属性名称以及与所述属性名称对应的所述海量预处理数据中的数据构成;
根据预设固化策略,确定固化维度组合并确定构成最优固化维度组合的运算路径;
根据所述递推拓扑,生成计算任务;
根据所述固化维度组合以及所述最优固化维度组合的运算路径,启动计算任务,计算所述计算任务,获得计算结果。
2.根据权利要求1所述的方法,其特征在于,在所述根据预处理后的海量预处理数据,生成递推拓扑之前,还包括:
接收海量待处理数据;
对所述海量待处理数据进行流水预处理,获得海量预处理数据。
3.根据权利要求2所述的方法,其特征在于,所述对所述海量待处理数据进行流水预处理,获得海量预处理数据,包括:
根据所述海量待处理数据以及预设选择预处理规则,确定与所述海量待处理数据对应的预处理规则;
根据所述预处理规则,对所述海量待处理数据进行清洗处理,获得第一处理数据;
根据预设抽取字段规则,在所述第一处理数据中抽取多维度拆分所需的至少一个字段或者至少一个字段组合;
根据抽取的所述至少一个字段或者至少一个字段组合生成宽表,并将所述至少一个字段或者至少一个字段组合保存在所述宽表中;
将所述宽表中保存的所述至少一个字段或者至少一个字段组合进行压缩,获得所述海量预处理数据。
4.根据权利要求3所述的方法,其特征在于,所述将所述宽表中保存的所述至少一个字段或者至少一个字段组合进行压缩,获得所述海量预处理数据,包括:
将所述宽表中保存的所述至少一个字段或者至少一个字段组合进行轻量压缩,获得所述海量预处理数据。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述根据所述固化维度组合以及所述最优固化维度组合的运算路径,启动计算任务,包括:
获取所述固化维度组合,并确定待计算的固化维度组合;
根据所述待计算的固化维度组合,确定第一最优固化维度组合的运算路径,所述最优固化维度组合的运算路径包括所述第一最优固化维度组合的运算路径;
根据所述第一最优固化维度组合的运算路径启动所述计算任务。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一最优固化维度组合的运算路径启动所述计算任务,包括:
将所述第一最优固化维度组合的运算路径中的所述待计算的固化维度组合按照路径递推关系进行分组,获得第一分组;
当所述第一分组中存在相同路径递推关系时,合并所述第一分组中具有所述相同路径递推关系的固化维度组合,获得第二分组;
按照所述路径递推关系并行启动计算所述第二分组中的各个固化维度组合的所述计算任务,多路获得所述计算结果。
7.根据权利要求6所述的方法,其特征在于,所述计算所述计算任务,获得计算结果,包括:
按照启动的所述计算任务进行并行计算,多路获得计算结果。
8.根据权利要求7所述的方法,其特征在于,所述按照启动的所述计算任务进行并行计算,多路获得计算结果之后,还包括:
将所述多路获得的所述计算结果,分别保存在对应的列表中,其中一路计算结果对应一个列表。
9.根据权利要求8所述的方法,其特征在于,在所述将所述多路获得的所述计算结果,分别保存在对应的列表中之后,还包括:
将保存在列表中的所述计算结果存储在分布式数据库中,并对保存在列表中的所述计算结果中的关键维度组合保存在内存中,所述关键维度组合包括用户经常查询的维度组合或者用户预设时间段内使用的维度组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310381567.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据统计方法和装置
- 下一篇:一种基于微博的业务数据的发布方法、装置和系统