[发明专利]一种事实数据集在外存中而维数据集在内存中的序号计算多对一join的方法在审

专利信息
申请号: 201710820847.8 申请日: 2017-09-13
公开(公告)号: CN107590082A 公开(公告)日: 2018-01-16
发明(设计)人: 蒋步星 申请(专利权)人: 北京润乾信息系统技术有限公司
主分类号: G06F12/06 分类号: G06F12/06
代理公司: 暂无信息 代理人: 暂无信息
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种事实数据集在外存中而维数据集在内存中的序号计算多对一join的方法。对在外存中的事实数据集A进行如下准备工作,把事实数据集A中的外键键值替换成所对应维数据集B中主键键值所在记录的位置序号,全部替换完以后进行保存,比如对应的记录在维数据集B中的位置是第N个记录,那么键值替换的位置序号就是N,替换所需要的时间可以用hash方法算出;在准备工作做完以后,往内存中加载维数据集B;以后再从事实数据集A中外键键值找对应维数据集B中主键键值所在的记录,就可以根据位置序号找到维数据集B中对应的位置记录了,就直接可以引用这条记录了。
搜索关键词: 一种 事实 数据 外存 内存 中的 序号 计算 join 方法
【主权项】:
一种事实数据集在外存中而维数据集在内存中的序号计算多对一join的方法,步骤如下:a.对在外存中的事实数据集A进行如下准备工作,把事实数据集A中的外键键值替换成所对应维数据集B中主键键值所在记录的位置序号,全部替换完以后进行保存,比如对应的记录在维数据集B中的位置是第N个记录,那么键值替换的位置序号就是N,替换所需要的时间可以用hash方法算出;(这是一次性准备工作,以后再计算这两个多对一join数据集时就不需要做这步准备了。此步骤所需要的成本和以前解决多对一join用hash方法解决的成本一样。)b.在准备工作做完以后,往内存中加载维数据集B;(事实数据集A一次替换完保存以后可多次加载维数据集B,而一次加载维数据集B以后可以进行多次计算。)c.以后再从事实数据集A中外键键值找对应维数据集B中主键键值所在的记录,就可以根据位置序号找到维数据集B中对应的位置记录了,就直接可以引用这条记录了。(此发明优点是省略了遍历比较动作,原来技术的比较动作是根据事实数据集A中的外键键值关键字遍历找维数据集B中对应的主键键值关键字,从而确定关键字所在的记录位置。现在只需要做一次准备工作就可以满足以后需要计算多对一join数据集的情况了,原来技术是每次计算多对一join都要做一次hash计算。)
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京润乾信息系统技术有限公司,未经北京润乾信息系统技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710820847.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top