[发明专利]分组聚集排序TopK查询处理方法及系统有效

申请号：	201310484629.3	申请日：	2013-10-16
公开（公告）号：	CN103544259B	公开（公告）日：	2017-01-18
发明（设计）人：	云晓春;徐小琳;王明华;高胜;李高超;常为领;王勇;王树鹏;张永铮	申请（专利权）人：	国家计算机网络与信息安全管理中心;中国科学院信息工程研究所
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	北京轻创知识产权代理有限公司11212	代理人：	杨立
地址：	100029***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种分组聚集排序TopK查询处理方法及系统。分组聚集排序TopK查询处理方法包括接收分组聚集排序TopK查询请求；各分布式数据节点根据所述查询请求，进行本地数据分组聚集，并将自身的分组聚集数据异步传输到集中处理节点；所述集中处理节点采用哈希表结合二叉平衡树的数据结构对各分布式数据节点的分组聚集数据进行数据合并，并采用近似高频项统计算法进行统计，得到聚集排序后的高频项列表；输出所述高频项列表。本发明的分组聚集排序TopK查询处理方法及系统灵活性好，查询效率高，分布式适应性好。
搜索关键词：	分组聚集排序 topk 查询处理方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种分组聚集排序TopK查询处理方法，应用于分布式数据存储系统，其特征在于，包括：步骤一，接收分组聚集排序TopK查询请求；步骤二，各分布式数据节点根据所述查询请求，进行本地数据分组聚集，并将自身的分组聚集数据异步传输到集中处理节点；步骤三，所述集中处理节点采用哈希表结合二叉平衡树的数据结构对各分布式数据节点的分组聚集数据进行数据合并，并采用近似高频项统计算法进行统计，得到聚集排序后的高频项列表；所述步骤三包括：初始化第二数据项队列和TopK队列，第二数据项队列为集中处理节点的数据项队列，所述第二数据项队列包括第二哈希表和第二双向链表，第二哈希表用于保存分组内容，第二双向链表用于保存第二哈希表中分组内容对应的保存地址，TopK队列包括第三哈希表、二叉平衡树和树内链表，并设置第二计数值，所述第二计数值为所述第二哈希表表项个数；对于每一个新数据项item，依次判断第二数据项队列和TopK队列中是否存在对应的分组内容；根据判断结果进行数据合并；将二叉平衡树调整至平衡；待所有新数据项都处理完毕后，后根遍历TopK队列，得到聚集排序后的高频项列表；步骤四，输出所述高频项列表。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;中国科学院信息工程研究所，未经国家计算机网络与信息安全管理中心;中国科学院信息工程研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201310484629.3/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]分组聚集排序TopK查询处理方法及系统有效

专利文献下载