[发明专利]键值数据表的连接方法及装置有效
申请号: | 201611182420.1 | 申请日: | 2016-12-20 |
公开(公告)号: | CN108205571B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 胡懋地;林文辉 | 申请(专利权)人: | 航天信息股份有限公司 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/22 |
代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 刘爱丽 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 键值 数据表 连接 方法 装置 | ||
本发明提供了一种键值数据表的连接方法及装置,其方法包括:获取第一键值数据表中每个第一关键字对应的第一布隆数组,以及获取第二键值数据表中每个第二关键字对应的第二布隆数组;过滤掉第一布隆数组、第二布隆数组对应的一定不存在重复关系的第一关键字和第二关键字;根据过滤处理后的第一布隆数组对应的第一关键字、第二布隆数组对应的第二关键字,进行第一键值数据表和第二键值数据表的连接。本发明实施例提供的键值数据表的连接方法及装置,先过滤掉需要连接的第一键值数据表与第二键值数据表中一定不存在重复关系的第一关键字与第二关键字,再进行连接,减少了需要连接的数据总量,从而减少了计算成本,提高了计算效率。
技术领域
本发明涉及数据库领域,尤其涉及一种键值数据表的连接方法及装置。
背景技术
键值(key-Value)存储数据库是一种已经被广泛采用的非关系型(NoSQL)数据库模型,其数据按照键值对的形式进行组织、索引和存储。使用键值存储数据可进行存储时,会根据不同的条件进行存储,如一个学校的学生信息,存储时可能将全校学生的学号、科目和成绩存储为一张数据表,将班级内学生的姓名及学号存储为另一张数据表,若是想获得包含学生姓名及成绩的数据表,就需要根据学号将上述两个数据表进行连接、合并。此时关键字为学号,而学生姓名、科目及成绩为根据关键字连接、合并的数据。现阶段的数据表连接时,可以根据二叉树结构对数据表中的数据进行检索。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:二叉树的节点数据均紧密相连,进行数据连接时,数据表中的数据存在大量一定不相关的数据。对数据进行连接时,需要读取存在的一定不相关数据,效率较低。
发明内容
有鉴于此,本发明利用布隆过滤器不会漏报的特点,提供了一种键值数据表的连接方法及装置,减少计算成本,提高计算效率。
本发明实施例提供一种键值数据表的连接方法,包括:
获取第一键值数据表中每个第一关键字对应的第一布隆数组,以及获取第二键值数据表中每个第二关键字对应的第二布隆数组;
过滤掉所述第一布隆数组、所述第二布隆数组对应的一定不存在重复关系的第一关键字和第二关键字;
根据过滤处理后的所述第一布隆数组对应的第一关键字、所述第二布隆数组对应的第二关键字,进行所述第一键值数据表和所述第二键值数据表的连接。
可选地,在本发明实施例中,所述第一布隆数组为根据哈希函数对所述第一键值数据表中的所述第一关键字进行映射得到的比特数组,所述第二布隆数组为根据哈希函数对所述第二键值数据表中的所述第二关键字映进行射得到的比特数组。
可选地,在本发明实施例中,所述过滤掉所述第一布隆数组、所述第二布隆数组对应的一定不存在重复关系的第一关键字和第二关键字包括:
根据第一布隆数组和所述第二布隆数组获得过滤数组,所述过滤数组分别与所述第一布隆数组、所述第二布隆数组进行比对,过滤掉所述第一布隆数组、所述第二布隆数组对应的一定不存在重复关系的第一关键字和第二关键字。
可选地,在本发明实施例中,所述根据第一布隆数组和所述第二布隆数组获得过滤数组,根据过滤数组过滤掉所述第一布隆数组、所述第二布隆数组对应的一定不存在重复关系的第一关键字和第二关键字包括:
对所述第一键值数据表对应的所有所述第一布隆数组进行处理得到第一统计数组,以及对第二键值数据表对应的所有所述第二布隆数组进行处理得到第二统计数组;
根据所述第一统计数组和所述第二统计数组获得过滤数组,过滤数组分别与所述第一布隆数组、所述第二布隆数组进行比对,过滤掉所述第一布隆数组、所述第二布隆数组对应的一定不存在重复关系的第一关键字和第二关键字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天信息股份有限公司,未经航天信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611182420.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据检测方法和装置
- 下一篇:一种搜索方法、装置及设备