[发明专利]度量空间最优完全划分索引寻找方法、装置及相关组件有效
申请号: | 202110612925.1 | 申请日: | 2021-06-02 |
公开(公告)号: | CN113282337B | 公开(公告)日: | 2023-02-24 |
发明(设计)人: | 毛睿;戴英龙;赖裕雄;王毅;刘刚;陆克中;陆敏华;陈倩婷 | 申请(专利权)人: | 深圳大学 |
主分类号: | G06F8/77 | 分类号: | G06F8/77 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 武志峰 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 度量 空间 最优 完全 划分 索引 寻找 方法 装置 相关 组件 | ||
本发明公开了度量空间最优完全划分索引寻找方法、装置及相关组件,该方法包括:利用选点方法从数据集中选取n个支撑点,构成支撑点空间,然后将数据映射至支撑点空间;将划分方式的权值向量设置为划分支撑点空间超平面的法向量候选集;按照多种选取排列方式在法向量候选集中各选取n个线性无关的法向量,得到对应的多种选取排列结果,并作为对应的划分方式;利用每一种划分方式中的n个线性无关的法向量对支撑点空间进行完全线性划分,得到对应的划分结果;在每一种排列方式对应的划分结果中,根据落入目标区域内的数据个数确定最优的划分方式。本发明实施例可以确定不同划分方式的性能差异,进而获得性能最优的划分方式。
技术领域
本发明涉及计算机软件技术领域,特别涉及度量空间最优完全划分索引寻找方法、装置及相关组件。
背景技术
现有的度量空间树形索引大多是基于距离划分的,利用数据到支撑点的距离关系将数据空间划分成多个较小的区域以求在进行范围查找时可以排除掉部分区域而提高搜索的效率。基于划分的度量空间索引在创建索引时,或基于空间或基于数据分布将数据空间划分成多个子区域。现有的基于划分的度量空间索引,根据划分结果的子空间的逻辑形态,大多可以分为以球形划分为基础和以超平面为基础两部分。
基于球形划分的索引方法利用支撑点和半径作为参数将空间划分成多个球子空间,典型的形态有以vp-tree为代表的对空间进行球形划分和以M-tree为代表的层次球形划分两种。vp-tree直接利用数据到支撑点的距离,将数据划分成球内和球外两个部分,而M-tree利用最小边界球的形式将数据进行平衡划分。
基于超平面划分的核心思想是将数据划分到离自己最近的支撑点所代表的区域,划分后的空间在逻辑上显现出Voronoi的形态。基于超平面划分的最基本形式是JeffreyK.Uhlmann提出来的超平面树gh-tree和Sergey Brin提出了GNA-tree。超平面划分的结果具有良好的几何特性,其划分所得的各区域之间不相互重叠。
但是当前对经典索引的优化,在划分边界的形态上着手对索引进行优化的方式较少,BM-index利用数据到支撑点距离的加权信息进行划分,是目前少有的从划分边界的形态上对索引进行优化例子。造成这种局面的原因一方面是不同索引之间的性能比较都是通过各自的实验进行的,而不同的索引方法的索引条件往往是不相同的,性能影响也由多个因素共同决定,支撑点的不同、划分方式的不同、索引的平衡性等等都会对索引的性能造成较大的影响。利用不同的索引直接进行性能比较,没有一套统一的模型可以客观地对不同方法的优劣进行评价,因此无法客观地反映潜藏在实验背后的不同划分方式的内在差异,同时实验采用的数据集的不同和实验环境的差异也大大降低了仅利用实验结果得出的结论的客观性。另一方面,度量空间中不同的划分方式的形态各异难以统一,而大部分数学工具都无法在度量空间中使用,因此对划分方式的探索没有明确的研究方向,从而加大了从划分方式对索引进行优化的难度。
发明内容
本发明实施例提供了一种度量空间最优完全划分索引寻找方法、装置及相关组件,旨在对不同的划分方式的性能进行衡量,以确定最优的划分方式。
第一方面,本发明实施例提供了一种度量空间最优完全划分索引寻找方法,包括:
将预先设置的数据集中的数据输入至度量空间中,并利用选点方法从所述数据集中选取n个支撑点,构成支撑点空间,然后将数据映射至所述支撑点空间;
将预先设置的划分方式的权值向量设置为划分支撑点空间超平面的法向量候选集;
按照多种选取排列方式在所述法向量候选集中各选取n个线性无关的法向量,得到对应的多种选取排列结果,并将每一种选取排列结果作为对应的划分方式;
利用每一种划分方式中的n个线性无关的法向量对所述支撑点空间进行完全线性划分,得到每一种排列方式对应的划分结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110612925.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文档数据库检索方法与装置
- 下一篇:一种机械加工用盘式抛光装置