[发明专利]数据去重查询的实现方法和实现装置在审
申请号: | 201310353978.1 | 申请日: | 2013-08-14 |
公开(公告)号: | CN103399944A | 公开(公告)日: | 2013-11-20 |
发明(设计)人: | 宋怀明;王勇;苗艳超;刘新春;邵宗有 | 申请(专利权)人: | 曙光信息产业(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京德恒律治知识产权代理有限公司 11409 | 代理人: | 章社杲;孙征 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 查询 实现 方法 装置 | ||
技术领域
本发明涉及数据库存储领域,具体来说,涉及一种数据去重查询的实现方法和实现装置。
背景技术
消除重复记录是目前数据库系统中常见的查询操作类型,这类查询通常也称作去重查询。比如数据库应用系统通常需要列出所有不相同的记录,或者统计不相同的记录,或者统计不相同的记录的数量。
在单个数据库系统中,目前比较成熟的消除重复的方法主要有排序合并方法和散列合并方法。但是在由多个相互独立的数据库系统组成的数据库集群中,重复记录可能分布在不同的数据库服务器上,而由于数据库节点之间的网络传输和通信的开销,增加了跨节点数据去重查询的处理难度,此时就不能用现有的排序合并方法和散列合并的方法进行消除重复了,基于这一情况,人们想到了利用去重列划分的方式进行消除重复查询,然而,通常针对去重列的Hash数据划分策略,虽然能够很好的减少节点之前的数据交互,但是在面对其他属性的去重查询时,却也不可避免的引入节点之间大量的数据交互,增加了查询处理的复杂度,进而无法解决任意数据列的消除重复查询的问题,而且,现有的利用去重列的方式进行消除重复查询,在对查询结果汇总时,有可能会有重复的计算,使得消除重复查询的效率不是很理想。
针对相关技术中无法解决任意数据列的消除重复查询、以及在查询结果汇总时有重复计算,导致消除重复查询的效率不是很理想的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中无法解决任意数据列的消除重复查询、以及在查询结果汇总时有重复计算,导致消除重复查询的效率不是很理想的问题,本发明提出一种数据去重查询的实现方法和实现装置,能够解决现有相关技术不能在数据库集群上进行大规模数据的去重查询的问题,实现了任意数据列的去重查询。
本发明的技术方案是这样实现的:
根据本发明的一个方面,提供了一种数据去重查询的实现方法。
该数据去重查询的实现方法包括:
对多个数据库节点中的每个数据库节点进行查询,得到查询结果,其中,对于每个查询到多个查询结果的数据库节点,对从该数据库节点查询得到的多个查询结果进行去重操作,并将去重操作得到的结果作为该数据库节点的查询结果;
对多个数据库节点的查询结果进行合并。
其中,在对多个查询结果进行去重操作时,可根据预定的排序方式对需要去重的查询结果进行排序,并基于排序后的查询结果进行去重操作。
其中,在对多个数据库节点的查询结果进行合并时,可对至少两个数据库节点的查询结果进行合并,并且,将合并后的查询结果存储至预定的存储区域内;并对于未合并的数据库节点查询结果,将未合并的数据库节点的查询结果与存储区域内的查询结果进行合并。
可选地,在将未合并的数据库节点的查询结果与存储区域内的查询结果进行合并时,在未合并的数据库节点的查询结果为多个的情况下,将多个未合并的数据库节点的查询结果依次与存储区域内的查询结果进行合并。
可选地,在将未合并的数据库节点的查询结果与存储区域内的查询结果进行合并时,在未合并的数据库节点的查询结果为多个的情况下,将多个未合并的数据库节点的查询结果以批量的方式与存储区域内的查询结果进行合并。
可选地,在将未合并的数据库节点的查询结果与存储区域内的查询结果进行合并时,在未合并的数据库节点的查询结果为多个的情况下,预先将存储区域内的剩余空间划分为多个对应的存储子区域,并将多个未合并的数据库节点的查询结果按照预定的对应关系存储至对应的存储子区域,并在多个未合并的数据库节点的查询结果存储至对应存储子区域后,将存储子区域内的查询结果与存储区域内的原查询结果进行合并。
可选地,对于每个数据库节点,在将去重操作得到的结果作为该数据库节点的查询结果后,按照预定策略对该数据库节点的查询结果进行范围划分,得到多个查询结果组,并且,将每个查询结果组分别发送给与该数据库节点对应的其他数据库节点,以便其他数据库节点根据接收到的查询结果组对其他数据库节点的查询结果进行去重操作。
其中,在按照预定策略对数据库节点的查询结果进行范围划分时,可按照预定的排序方式对数据库节点的查询结果进行排序,并且对排序后的查询结果进行等分。
可选地,在对多个数据库节点的查询结果进行合并后,可对合并的查询结果进行去重操作。
根据本发明的另一方面,提供了一种数据去重查询的实现装置。
该数据去重查询的实现装置包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曙光信息产业(北京)有限公司,未经曙光信息产业(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310353978.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于MGC3130芯片的手势识别一体机
- 下一篇:一种平板电脑上用的底板
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置