[发明专利]一种数据表分析处理的方法和装置有效
申请号: | 201610042109.0 | 申请日: | 2016-01-21 |
公开(公告)号: | CN106991101B | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 王伟;潘旻;罗金鹏 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/28 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 赵娟 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据表 分析 处理 方法 装置 | ||
1.一种数据表分析处理的方法,其特征在于,所述数据表包括数据公共层的通用数据表,以及,非数据公共层的外部数据表,所述的方法包括:
针对所述数据公共层的通用数据表计算加工成本数据;
确定所述非数据公共层的外部数据表所依赖的通用数据表;
依据所述通用数据表的加工成本数据,计算所述外部数据表的使用成本数据;
其中,所述针对所述数据公共层的通用数据表计算加工成本数据的步骤包括:
提取所述数据公共层的通用数据表的加工成本特征参数;
采用所述加工成本特征参数计算所述通用数据表的加工成本数据;
所述加工成本特征参数包括第一扫描成本参数;所述第一扫描成本参数包括所述通用数据表所依赖的父表的数量,所述通用数据表对所述父表的扫描量以及所述父表下所有子表的数量;
其中,所述采用所述加工成本特征参数计算所述通用数据表的加工成本数据的子步骤进一步包括:
采用所述通用数据表所依赖的父表数量,所述通用数据表对所述父表的扫描量,以及,所述父表下所有子表的数量,计算出第一扫描成本参数;
所述加工成本特征参数还包括第一计算成本参数,以及,第一存储成本参数,所述提取所述数据公共层的通用数据表的加工成本特征参数的子步骤进一步包括:
提取所述通用数据表的复杂度CU作为第一计算成本参数;
提取所述通用数据表的存储量作为第一存储成本参数。
2.根据权利要求1所述的方法,其特征在于,通过如下公式采用所述通用数据表所依赖的父表数量,以及,所述通用数据表对所述父表的扫描量,以及,所述父表下所有子表的数量,计算出第一扫描成本参数:
其中,Cost(j)为数据表j的加工成本数据,
数据表j为数据表i所依赖的m张父表,编号为1…m,
ScanSize(i,j)为通用数据表i对父表j的扫描量,
数据表m为父表j的所有子表,编号为1…n。
3.根据权利要求2所述的方法,其特征在于,通过如下公式采用所述加工成本特征参数计算所述通用数据表的加工成本数据:
其中,ComputeCost(i)为通用数据表i的第一计算成本参数;
StorageCost(i)为通用数据表i的第一存储成本参数;
ScanCost(i,j)为通用数据表i对父表j的第一扫描成本参数。
4.根据权利要求1所述的方法,其特征在于,所述依据所述通用数据表的加工成本数据,计算所述外部数据表的使用成本数据的步骤为,
依据所述通用数据表的加工成本特征参数,计算所述外部数据表的使用成本数据。
5.根据权利要求4所述的方法,其特征在于,所述依据所述通用数据表的加工成本特征参数,计算所述外部数据表的使用成本数据步骤包括:
提取所述非数据公共层的外部数据表所依赖的通用数据表的加工成本特征参数;
采用所述加工成本特征参数计算所述外部数据表的使用成本特征参数;
采用所述使用成本特征参数计算所述外部数据表的使用成本数据。
6.根据权利要求5所述的方法,其特征在于,所述使用成本特征参数包括第二计算成本参数;
所述提取所述非数据公共层的外部数据表所依赖的通用数据表的加工成本特征参数的子步骤为:
提取所述外部数据表所依赖的通用数据表的第一计算成本参数;
所述采用所述加工成本特征参数计算所述外部数据表的使用成本特征参数的步骤包括:
获取所述外部数据表与其所依赖的通用数据表之间的计算成本计算因子;
采用所述计算成本计算因子校正所述第一计算成本参数,获得第二计算成本参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610042109.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据导入方法及装置
- 下一篇:倒排索引中键值对的处理方法及处理系统