[发明专利]高维向量空间中大规模图约束连接路径查询算法在审
申请号: | 201711011721.2 | 申请日: | 2017-10-26 |
公开(公告)号: | CN107832363A | 公开(公告)日: | 2018-03-23 |
发明(设计)人: | 丁琳琳;宋宝燕;王俊陆;单晓欢;陈博强;张师文 | 申请(专利权)人: | 辽宁大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 沈阳杰克知识产权代理有限公司21207 | 代理人: | 罗莹 |
地址: | 110136 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 向量 空间 大规模 约束 连接 路径 查询 算法 | ||
1.高维向量空间中大规模图约束连接路径查询算法,即Constraint Connection Process based on Vector Space,简称CCPBV算法,其特征在于,该算法引入Map-Reduce框架,在高维空间上的数据处理过程中具体包括以下步骤:
1)投影筛选:在高维数据空间中,随机挑选k个节点,将向量空间中的节点直接投影到某一维度对不具有代表性的节点进行删选;
2)降维删选:在高维空间上进行降维删选;
3)节点删选:在降维后的低维空间中进行数据节点的删选操作;
4)节点子集高维空间整合,输出约束连接路径。
2.按照权利要求1所述的高维向量空间中大规模图约束连接路径查询算法,其特征在于,所述步骤1)中所述的投影删选,具体包括如下步骤:
(1-1)选定投影的维度:采用概率选取,将向量空间分为若干单元格,在整个向量空间上随机选取n个节点,并在节点所在的邻近单元格内,随机选取一个备选节点,计算这n个节点到备选节点的投影距离,确定距离值最大的维度,将这n个节点距离值最大的维度进行自然归纳总结,最终选取次数出现最多的那一维度为选定维度;
(1-2)对节点进行删选:将空间中的节点投影到向量空间某一维度上,若在这一维度上该节点的投影距离已经超过了题设给定的约束距离ε,则这一节点可以直接删除不再进行具体的考虑。
3.按照权利要求1所述的高维向量空间中大规模图约束连接路径查询算法,其特征在于,所述步骤2)中所述的降维删选,具体包括如下步骤:
(2-1)为维度赋予特征码:根据节点在每一维度上的距离表现来进行排序,再为维度赋予特征码;在赋予特征码阶段,在高维空间中,随机找到n个节点,计算每个节点在每一维度上投影后的距离差D1、D2、……、Dm,选取每个节点投影距离最大的k个维度,统计每个维度被选取的次数,为选取次数较多的维度赋予一个较小的特征码;
(2-2)冒泡排序降维算法:在面对高维空间数据向量分布极不均匀的情况时,应用冒泡排序的思想进行降维策略的改进;提取步骤(2-1)中进行排序后的特征码,首先提取特征码最小的两个维度,由这两个维度组成一个新的低维空间;
(2-3)属性分类降维算法:若高维空间中的数据维度代表的是客观事物的属性,并且这些属性是可以进行分类的,则可人为的将同一个属性划分为同一个低维空间,以此得到多个维度数不固定,具有一定的随机性的低维空间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁大学,未经辽宁大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711011721.2/1.html,转载请声明来源钻瓜专利网。