[发明专利]一种基于排序的频繁更新数据集上的k-支配Skyline查询算法在审
申请号: | 201710376261.7 | 申请日: | 2017-05-25 |
公开(公告)号: | CN108932251A | 公开(公告)日: | 2018-12-04 |
发明(设计)人: | 郑志蕴;王宁;张行进;李伦;王振飞;李钝 | 申请(专利权)人: | 郑州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 450001 河南*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 算法 更新数据 排序 数据管理 计算机领域 数据预处理 查询 查询方向 动态数据 能力构建 新数据 分块 索引 删除 维护 | ||
本发明涉及计算机领域中数据管理与查询方向,公开了一种基于排序的频繁更新数据集上的k‑支配Skyline查询算法。首先对数据预处理,按支配能力构建分块有序数据。在此基础上,通过k‑支配Skyline点计算算法,维护k‑支配Skyline点的索引。最后针对变化的数据,利用插入、删除算法得到新数据集的k‑支配Skyline点。本发明减少了数据间的比较次数,提升了计算k‑支配Skyline点效率,解决了动态数据集中k‑支配Skyline点的计算问题。
技术领域
本发明涉及一种基于排序的频繁更新数据集上的k-支配Skyline查询算法,属于计算机领域中数据管理与查询方向。
背景技术
Skyline查询问题也被称为帕累托最优问题或者极大向量问题,在多目标优化查询,数据可视化等方面有着广泛应用。目前,在WEB信息系统、P2P网络、数据流等方向得到了广泛的研究,现今已成为数据库和信息检索领域的研究热点之一。Skyline查询的思想是在给定d维属性元组集合中,查询一个Skyline支配点集合。所谓一个数据点p(p1,p2,...,pd)支配另一个数据点q(q1,q2,...,qd),是指p点在所有维度上的值都不差于q点,并且至少有一个维度上的值优于q。这些支配点的集合就是所要查询的Skyline支配点集合。
在实际应用中,数据经常是高维度的。当数据的维度增加时,一个元组支配另一个元组的可能性随之变低,Skyline查询就出现了“维度诅咒”的问题,这将导致大量的数据点在Skyline查询中被返回,返回大量的数据点使Skyline查询不能提供有用的信息。为了在高维空间中找到重要的数据点,并减少返回的结果集,Chan等人提出了k-支配Skyline查询的概念。通过弱化“支配”的定义,使数据点之间更容易产生支配关系,从而使结果集缩小到一个合适范围内。目前k-支配Skyline查询算法主要有两种:基于排序的算法和不带排序的算法。不带排序的算法主要问题是数据点之间存在着过多无意义的比较。为了减少数据点间的重复比较,本专利利用分治策略的思想对数据预处理。数据按照支配能力大小排序,使支配能力高的数据点优先被处理,从而提高算法性能。
数据库中的节点通常是动态变化的。当数据集中的数据点更新时,重新对节点排序,计算k-支配Skyline点显然是效率低下的。本专利针对数据节点常见的插入和删除操作,提出了频繁更新数据集上的k-支配Skyline查询算法。
发明内容
本发明提供一种基于排序的频繁更新数据集上的k-支配Skyline查询算法。通过数据集的排序,剪枝策略,减少数据点之间的重复比较,建立k-支配Skyline点的树形结构,维护k-支配Skyline点的索引。当数据集更新时,通过插入、删除算法维护k-支配Skyline点。
本发明采用的技术方案如下:
本发明提供一种基于排序的频繁更新数据集上的k-支配Skyline查询算法。首先对数据预处理,按支配能力构建分块有序数据集。在此基础上,通过k-支配Skyline点计算算法,维护k-支配Skyline点的索引。最后针对变化的数据,利用插入、删除算法得到新数据集的k-支配Skyline点。因此,本发明其特征主要包括以下步骤:
(1)对数据集预处理;
(2)计算k-支配Skyline点,维护k-支配Skyline点的索引;
(3)k-支配Skyline数据点的更新维护,包括数据点的插入、删除。
具体变量描述情况如表1所示:
表1变量描述
下面是对每个步骤实现的具体描述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学,未经郑州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710376261.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种管理文件系统的方法及装置
- 下一篇:视频聚合方法及装置