[发明专利]一种级联连接方法及设备有效
申请号: | 201810011679.2 | 申请日: | 2018-01-05 |
公开(公告)号: | CN108090224B | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 刘浩;陈振强 | 申请(专利权)人: | 星环信息科技(上海)有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 佘猛;邵栋 |
地址: | 200233 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 级联 连接 方法 设备 | ||
1.一种级联连接方法,其中,所述方法包括:
分别确定与事实表级联连接的多个维度表的过滤率,包括:
通过广播的方式获取每个所述维度表的所有行及其总行数;基于用户需求分别对每个所述维度表中的所有行进行过滤,得到每个维度表用于实际连接的行的实际连接行数;基于每个所述维度表的总行数和实际连接行数,得到每个所述维度表的过滤率,其中,所述维度表的过滤率为:(维度表的总行数-维度表的实际连接行数)/维度表的总行数;
基于每个所述维度表的过滤率,分别得到所述多个维度表对应的连接顺序和所述事实表的过滤条件,包括:
按照所述过滤率从大到小的顺序,对与所述事实表级联连接的多个维度表进行排序,并将得到的排序顺序确定为所述连接顺序,基于所述多个维度表的过滤率,生成所述事实表的过滤条件;
基于所述过滤条件和所述维度表,按照所述连接顺序,对所述事实表中的所有行进行过滤,得到所述事实表中的过滤后的至少一行;
将所述事实表中的过滤后的每一行,按照所述连接顺序,分别与对应的每个维度表中的匹配行进行连接后,生成级联连接结果。
2.根据权利要求1所述的方法,其中,所述分别确定与事实表级联连接的多个维度表的过滤率之前,还包括:
将事实表与其级联连接的维度表之间的至少两个节点,合并为一个目标节点,其中,所述节点包括过滤节点和连接节点。
3.根据权利要求1所述的方法,其中,所述基于所述多个维度表的过滤率,生成所述事实表的过滤条件,包括:
获取每个所述维度表的键值相关信息;
基于所述多个维度表的过滤率和所述键值相关信息,生成所述事实表的过滤条件。
4.根据权利要求3所述的方法,其中,所述键值相关信息包括:
键值的类型、键值最大值、键值最小值及键值的个数。
5.根据权利要求2所述的方法,其中,所述基于所述过滤条件和所述维度表,按照所述连接顺序,对所述事实表中的所有行进行过滤,得到所述事实表中的过滤后的至少一行,包括:
从所述事实表中的所有行中任意选取一行作为目标行;
判断所述目标行是否满足所述过滤条件,
若是,则按照所述连接顺序,在所述连接顺序依序对应的每个维度表中,判断是否均存在至少一个与所述目标行匹配的匹配行;
若是,则将所述目标行确定为所述事实表中的过滤后的行;
重复上述步骤,直至遍历完所述事实表中的所有行,得到所述事实表中的过滤后的至少一行。
6.一种非易失性存储介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行时,使所述处理器实现如权利要求1至5中任一项所述的方法。
7.一种用于级联连接的设备,其中,所述设备包括:
一个或多个处理器;
非易失性存储介质,用于存储一个或多个计算机可读指令,
当所述一个或多个计算机可读指令被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至5中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于星环信息科技(上海)有限公司,未经星环信息科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810011679.2/1.html,转载请声明来源钻瓜专利网。