[发明专利]一种基于Blogel的分布式时态图可达性查询处理方法在审
申请号: | 201910566655.8 | 申请日: | 2019-06-27 |
公开(公告)号: | CN110377795A | 公开(公告)日: | 2019-10-25 |
发明(设计)人: | 高云君;张天明;陈刚;浦世亮 | 申请(专利权)人: | 浙江大学;杭州海康威视数字技术股份有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/903 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 应孔月 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 时态 可达性 查询 查询处理 索引 标签集合 剪枝技术 搜索空间 判定 分布式计算框架 短时间间隔 图拓扑结构 标签索引 并行技术 查询结果 查询效率 顶点计算 时间查询 时态信息 索引构建 有效组织 缩小图 有效地 构建 返回 | ||
本发明公开了一种基于Blogel的分布式时态图可达性查询处理方法。本发明提出了三种时态图可达性查询,一为普通时态图可达性查询;二为最短时间间隔查询;三为最早到达时间查询。本发明基于Blogel分布式计算框架,利用时态顶点标签索引TVL,有效组织时态图的时态信息和图拓扑结构;利用批量和并行技术,提升TVL索引的构建效率;利用索引判定方法和剪枝技术,缩小图搜索空间,提升查询效率。本发明先在TVL索引构建阶段为每个顶点计算其可达的规范顶点标签集合Lout和可达此顶点的规范顶点标签集合Lin。而后本发明在查询阶段利用剪枝技术有效地缩减查询搜索空间,依据索引判定方法快速返回查询结果。本发明极大地提高了可达性查询处理效率,提供了最佳的性能。
技术领域
本发明涉及计算机数据库领域中图可达性查询处理技术,特别是涉及一种基于Blogel的 分布式时态图可达性查询处理方法。
背景技术
图数据用于建模实体之间的关系。针对普通图上的可达性查询方法,目前国内外学者已 经做出了大量的工作。普通图模型在查询过程中忽略时态信息以简化计算。然而,现实世界 图常常附带时态信息,顶点之间的关系在某一时刻发生并持续一段时间结束,此种类型的图 称之为时态图。例如,在电话通信网络中,用户在不同的时间段进行多次通话。在社交网络 中,朋友选择在不同的时间段聚会。在交通调度网络中,火车(或者飞机)在特定时间段内 从始发点到终点目的地。
随着大数据时代的到来,时态图数据的规模呈指数型增长,单台机器已经无法有效地存 储整张时态图并高效地对时态图进行查询处理。因此,以Pregel为代表的分布式图迭代处理 系统应运而生。Pregel是Google提出的以顶点为中心的大规模分布式图计算平台,其遵循 Bulk Synchronous Parallel(BSP)模型,整个计算过程由若干顺序运行的超级步(SuperStep) 组成,系统从一个“超级步”迈向下一个“超级步”,直到达到算法的终止条件。Blogel系统 对Pregel进行了优化,其可支持以块(block)为中心的计算模型,进一步提升了分布式框架 处理效率。本发明基于Blogel系统,设计一个具有高可扩展性、高效率的时态图可达性查询 处理方法成为了学术界与工业界的迫切需求。
针对基于Blogel的分布式时态图可达性查询处理,一种基本方法是直接在时态图上进行 广度优先搜索。然而,这种方法需要遍历整张图才能得到最终的查询结果,查询时间复杂度 高。另一种方法是将时态图转化为普通图,然后利用普通图上已有的可达性查询算法进行处 理。这种方法得到的转化图规模是时态图的几十倍甚至几百倍,这导致基于普通图构建的索 引规模大,构建效率低,查询效率低。
发明内容
针对现有技术的不足,本发明提供一种基于Blogel的分布式时态图可达性查询处理方法, 该方法基于Blogel分布式计算框架,先在TVL索引构建阶段为每个顶点计算其可达的规范顶 点标签集合Lout和可达此顶点的规范顶点标签集合Lin。而后在查询阶段利用剪枝技术有效 地缩减查询搜索空间,依据索引判定方法快速返回查询结果。
为了达到上述目的,本发明所采用技术方案如下:一种基于Blogel的分布式时态图可达 性查询处理方法,该方法的步骤如下:
(1)为时态图中的每个顶点v分配一个唯一重要值ρ(v);
(2)用户提交k值;
(3)根据步骤(1)得到的顶点重要值ρ(v)和步骤(2)提交的k值,构建TVL(TemporalVertex Labeling)索引;
(4)用户提交查询源顶点,查询目的顶点,查询时间间隔,并且选择查询类型;
(5)根据步骤(4)选择的查询类型;在时态图上进行并行的广度优先遍历,利用剪枝 技术缩小每轮迭代中的子图搜索空间,利用TVL索引判定方法快速返回指定查询类型的结 果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学;杭州海康威视数字技术股份有限公司,未经浙江大学;杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910566655.8/2.html,转载请声明来源钻瓜专利网。