[发明专利]基于图谱和可达路径数的无向加权图的子图查询方法有效
申请号: | 201810523390.9 | 申请日: | 2018-05-28 |
公开(公告)号: | CN108804593B | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 朱磊;张彤;高勇;王一川;刘雁孝;姬文江;黑新宏;姚燕妮;刘征 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 谈耀文 |
地址: | 710048*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 路径数 子图查询 图数据 查询 图谱 无向加权图 节点标记 邻接边 索引树 边带 权重 筛选 图谱构建 拓扑信息 节点图 最底层 比对 存储 | ||
本发明公开了一种基于图谱和可达路径数的无向加权图的子图查询方法,步骤1,计算查询图和已知图数据集中每个图的节点标记的编码、边带权重的邻接边标记的编码和可达路径数的编码;步骤2,生成查询图和已知图数据集中每个图的图谱;步骤3,用已知图数据集中每个图的节点标记的编码、边带权重的邻接边标记的编码、可达路径数的编码和图谱构建索引树;步骤4,将查询图与索引树节点图由上至下逐层进行比对,同时进行筛选,直至筛选到最底层,所得图即为与查询图相近的候选图。本发明更好地描述了图的拓扑信息。同时,对这些特征进行编码,不仅容易存储,而且操作简单,可以加快特征之间的比较,从而加快整个子图查询的速度。
技术领域
本发明属于计算机数据挖掘技术领域,具体涉及一种基于图谱和可达路径数的无向加权图的子图查询方法。
背景技术
近几年,包括计算机在内的许多领域,都应用到图这一数据结构去描述数据信息。例如,在化学中,分子或原子被建模成节点,它们之间的化学键被建模成边;在计算机网络中,个人计算机被建模成节点,而它们之间的路由关系被建模成边。图的广泛应用触发了图数据库的模式查询,其中,子图查询成为了最重要的研究方向之一。子图查询问题可以归结为:给出一个图数据集和一个查询图,找出所有包含查询图的数据图的集合,即使得查询图是这些数据图的子图,而这个过程中包含着子图同构的判定问题,也就是一个已被证明是NPC的问题。
目前,都采用过滤-验证框架去提高查询效率,即在查询处理时,查询图先经过索引进行过滤,产生少量的候选图,然后再对候选图进行子图同构的验证,得到最终的结果集。在这个过程中,找寻高效的索引特征和索引方法成为了工作重心。
现今方法中寻找高效的索引特征和索引方法各有优点和不足。例如,Graphgrep方法中,将指定大小的路提取出来进行索引建立,在查询时,对于那些不包含在查询图中的路的数据图将被视为False Positives而被过滤,再经过验证得到最终结果集。但是这种方法中,由于路包含的信息太简单,不足以表达出图的整个结构信息,导致效率非常低。另一类方法,gIndex,FG-Index,Treepi,Tree+delta,SwiftIndex等,利用现存图挖掘技术挖掘频繁子结构,再选取部分子结构创建索引。这类方法一定程度上提高了查询的效率,但是,有一个通病:过滤效率取决于提取的特征的质量。随着图数据库后面不断变化,不断地进行添加和删除等更新操作,这些方法都必须重新开始挖掘和创建索引,这部分得花费很多时间。最后一类算法,如Gcoding方法,是将提取的特征映射到数字空间生成编码,在编码的基础上构建一个索引树,这样可以很好地处理图数据库频繁更新的情况。因为编码方法是对每个数据图单独进行处理,所以在图数据库更新时,只需对变更的数据图进行编码处理,不用全部重新进行编码。但是Gcoding在计算特征值时,使用中间生成树的结构进行特征提取,而树的结构会丢失图中的部分结构信息,这样降低了方法的过滤效率,一定程度上影响了查询效率。
发明内容
本发明的目的是提供一种基于图谱和可达路径数的无向加权图的子图查询方法,解决了现有技术中存在的Gcoding索引方法中中间生成树的结构会丢失图的部分结构信息,降低了过滤效率,从而降低查询效率的问题。
本发明所采用的技术方案是,基于图谱和可达路径数的无向加权图的子图查询方法,其特征在于:具体包括以下步骤:
步骤1,计算查询图和已知图数据集中每个图的节点标记的编码、边带权重的邻接边标记的编码和可达路径数的编码;
步骤2,生成查询图和已知图数据集中每个图的图谱;
步骤3,用已知图数据集中每个图的节点标记的编码、边带权重的邻接边标记的编码、可达路径数的编码和图谱构建索引树;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810523390.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:知识库检索实现方法
- 下一篇:一种新闻内容全文检索引擎的构建方法及装置