[发明专利]一种聚类分离的分布式索引方法有效

专利信息
申请号: 201610287204.7 申请日: 2016-05-03
公开(公告)号: CN105868414B 公开(公告)日: 2019-03-26
发明(设计)人: 袁鑫攀;汪灿飞;何频捷;梁圣;满君丰;向一平 申请(专利权)人: 湖南工业大学
主分类号: G06F16/13 分类号: G06F16/13;G06F16/22;G06F16/45
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 任重;冯振宁
地址: 412007 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出了一种聚类分离的分布式索引方法,简称CS‑Chord(Clustering separation‑Chord)。在M‑Chord分布式索引中,聚类的边缘向量一般比较稀少,这些稀少的向量使得每个聚类的半径变得很大。在范围查询的时候,半径越大的聚类越容易与范围查找的区域相交,从而使得候选查找的区域增多。而聚类的边缘向量又通常是高访问量的向量,性能进一步降低。本发明所述的CS‑Chord将聚类边缘的稀疏向量分离出来并集中存储在独立的服务器上,将稠密向量存储在Chord环中,查找时一方面高频的查询集中在独立服务器的向量,另一方面也减少了Chord环上的搜索范围,从而提高检索效率。
搜索关键词: 一种 分离 分布式 索引 方法
【主权项】:
1.一种聚类分离的分布式索引方法,其特征在于,包括以下步骤:步骤一:分离边缘稀疏向量,并使用独立的服务器集中存储边缘稀疏向量;步骤二:建立分布式索引,计算需要加入Chord环的边缘稀疏向量S的一维关键值Key(S),并将该向量插入到分布式索引,向量插入的具体过程为;(21)如果Key(S)≥n*C,其中n为聚类子空间的个数,C是一个常量,其值大于IDistance索引结构中环体内的向量映射到一维轴上的所有值,则将关键值Key(S)和向量S发送到独立的服务器上,然后将向量S插入到该独立服务器的B+‑Tree索引中,则该新向量插入完成;若Key(S)其中,因CS‑Chord的索引关键值的区间为[0,Kmax],Chord环的标识符空间范围为[0,2m‑1],故可将Xmin=0,Xmax=Kmax,Ymin=0,Ymax=2m‑1代入式(2),可得:步骤三:基于所构建的索引进行范围查询,设聚类分离的分布式索引方法CS‑Chord的范围查询Range(Q,r),其中Q为待查向量,r为查询范围半径,步骤如下:(31)通过IDistance计算出范围查询Range(Q,r)与聚类的相交区域,映射为多个关键值区间[xi,yi];(32)如果xi≥n*C,则将步骤(31)计算范围查询Range(Q,r)与聚类的相交区域发送到独立服务器上,转步骤(34),如果xi<n*C则转向步骤(33);(33)生成Chord环中的关键值范围[h(xi),h(yi)],通过查询路由表定位关键值h(xi)所在的节点,如果h(yi)大于节点中所存数据的关键值最大值Keymax,则将范围[Keymax,h(yi)]发送到该节点的后继节点,如果h(yi)仍比后继节点的Keymax大,则继续往它的后继节点发送查询信息,(34)每一个节点接收到查询请求,在此节点的B+‑Tree中检索关键值范围中是否有向量存在,若存在向量Z则与待查向量Q进行距离计算,当距离小于查询半径r,则将向量Z返回到最初发送请求的节点,若距离大于或等于查询半径r时,则返回空值, 若不存在向量,也返回空值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南工业大学,未经湖南工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610287204.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top