[发明专利]一种应用于大规模非规则结构数据的图搜索方法有效
申请号: | 201510872650.X | 申请日: | 2015-11-27 |
公开(公告)号: | CN105335524B | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 刘智勇;王晶晶;乔红;杨旭;苏建华 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F16/58 | 分类号: | G06F16/58 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 宋宝库 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 大规模 规则 结构 数据 搜索 算法 | ||
1.一种应用于大规模非规则结构数据的图搜索方法,其特征在于,包括数据预处理方法和查询执行方法;
数据预处理方法包括如下步骤:
步骤S11,将非规则结构数据统一为一种图的数据格式作为原图;统一数据格式后的每个图中的点为原图点;
步骤S12,为每个图的原图点构造一近邻标签向量表;
所述为每个图的原图点构造一近邻标签向量表的方法为:依据原图的m个不同的标签,为每个原图点构造一个m位的一近邻标签向量,若原图点存在标签为label_i的邻接点,则该原图点一近邻标签向量中对应的第i位取值为1,否则该位取值为0;
步骤S13,在统一数据格式后的每个图中加入新的点作为属性点,并添加对应的边,形成具有属性点的扩充图;
步骤S14,在扩充图上,使用重启动随机游走算法,以每个属性点为起点,计算属性点到每个原图点的概率;
查询执行方法包括如下步骤:
步骤S21,确定查询子图的关键性节点作为关键点,并在原图点中利用一近邻标签向量表筛选与关键点对应的点作为候选匹配点;
步骤22,计算候选匹配点的匹配度,并根据匹配度大小选择局部区域的中心点;
步骤23,在中心点周围进行局部区域的划分,利用松弛法进行查询子图和局部图的近似图匹配。
2.如权利要求1所述的一种应用于大规模非规则结构数据的图搜索方法,其特征在于,所述扩充图的构建方法为:依据原图的m个不同的标签加入m个属性点,这m个属性点的数据格式与原图点的数据格式完全相同,点序列号递增;以属性点为起点,以相同标签的其它原图点为终点,向原图中添加单向边。
3.如权利要求1所述的一种应用于大规模非规则结构数据的图搜索方法,其特征在于,所述候选匹配点的筛选方法为:
步骤211,在原图点中筛选出所有标签与关键点标签相同的原图点;
步骤212,对关键点的一近邻标签向量取反后与步骤211中筛选出来的原图点的标签向量进行或运算,若结果为全1向量,则将该原图点选为候选匹配点。
4.如权利要求1-3中任一项所述的一种应用于大规模非规则结构数据的图搜索方法,其特征在于,所述候选匹配点的匹配度的计算方法为:计算查询子图中关键点到其它点的概率,并结合步骤S14中的属性点到每个原图点的概率,按照如下公式计算候选匹配点与关键点的匹配度g(q,i),
其中查询子图q中的点的下标用l和k表示,k为查询子图的关键点下标,l为查询子图的非关键点下标;扩充图G'中下标用l_label和i表示,其中i表示候选匹配点的下标,l_label表示q中非关键点l对应的G'中属性点的下标;rl_label,i代表属性点到候选匹配点的R值,rl,k表示查询子图中非关键点l到关键点k的R值。
5.如权利要求4所述的一种应用于大规模非规则结构数据的图搜索方法,其特征在于,所述根据匹配度大小选择局部区域的中心点的方法为:按照候选匹配点与关键点的匹配度递减顺排序,选择前K个点作为局部区域的中心点。
6.如权利要求5所述的一种应用于大规模非规则结构数据的图搜索方法,其特征在于,采用宽度优先遍历的方法进行局部区域的划分,具体为:设定遍历层数和点规模的阈值,以局部区域的中心点为根点进行宽度优先遍历,当点数达到点规模的阈值或层数的阈值或所有点都没有未经遍历的邻接点时,扩展停止,得到该中心点对应的局部区域。
7.如权利要求6所述的一种应用于大规模非规则结构数据的图搜索方法,其特征在于,在局部区域划分的过程中设置有中心点的邻接点的筛选过程,筛选依据为:
中心点的邻接点的标签属于查询子图的关键点的邻接点的标签的一种,则选择该中心点的邻接点加入局部区域,否则不予选择;
将中心点的邻接点的一近邻标签向量与关键点所有邻接点的一近邻标签向量取反后的向量组中各个向量依次做或运算,若存在结果为全1向量,则选择该中心点的邻接点加入局部区域,否则不予选择。
8.如权利要求7所述的一种应用于大规模非规则结构数据的图搜索方法,其特征在于,近似图匹配采用的松弛法为渐非凸渐凹化过程方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510872650.X/1.html,转载请声明来源钻瓜专利网。