[发明专利]哈希连接方法和装置有效
申请号: | 201480037464.8 | 申请日: | 2014-05-23 |
公开(公告)号: | CN105359142B | 公开(公告)日: | 2019-04-05 |
发明(设计)人: | 桑永嘉;李俊;施会华 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/00 | 分类号: | G06F16/00 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种哈希连接方法和装置。该方法在进行数据库查询时在目标数据组进行分组过程中,以vector为数量单位划分并计算数据段内原始数据的哈希值,并以比特位表示;再基于预设分组规则在哈希分组中,将位于指定位上取值相同的哈希值所对应的原始数据划分在同一小组内,在后续分组中利用前一次哈希分组中未被指定比特位继续执行哈希分组,同时,在进行分组的过程中,按照所述原始数据在目标数据组中的位置,对划分在同一小组中的原始数据进行排序,最后,再对进行分组以及排序后的待连接的目标数据组中对应分组中的原始数据进行连接操作。从而实现降低后续对各个分组进行排序的复杂度的目的。 | ||
搜索关键词: | 连接 方法 装置 数据库 管理 系统 | ||
【主权项】:
1.一种哈希连接方法,其特征在于,应用于数据库,包括:接收包含有连接Join操作的结构化查询语言SQL语句,解析获取至少两个待连接的目标数据组;以矢量vector为数量单位将每一目标数据组划分为多个数据段;基于预设分组规则依次对每一目标数据组中的数据段进行N次哈希hash分组,其中,在每次hash分组时,基于第1次hash分组计算所述数据段中的原始数据所得的用bit位表示的hash值,将当前hash分组过程中指定bit位上取值相同的hash值所对应的原始数据划分在同一小组内,并对划分在同一小组内的各个原始数据,按照各个原始数据在所述目标数据组中的位置在同一小组内进行排序并保存,N取大于或等于1的正整数;对每一目标数据组经过N次hash分组后获得的小组,在所述目标数据组中,按照各个小组中所包含的原始数据对应的hash值由小至大的对各个小组进行排序;按照排序依次取所述两个待连接的目标数据组中经由N次hash分组后获得的各个小组中的原始数据进行Join操作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201480037464.8/,转载请声明来源钻瓜专利网。
- 上一篇:高纯度头孢硫脒的制备方法
- 下一篇:反射式显示器设备