[发明专利]一种联邦型分布式RDF数据库上的多查询优化方法在审
申请号: | 201910000166.6 | 申请日: | 2019-01-01 |
公开(公告)号: | CN109710638A | 公开(公告)日: | 2019-05-03 |
发明(设计)人: | 葛琪;彭鹏;秦拯 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410082 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 重写 查询 查询匹配 数据库 三元组 数据源 优化 模式选择数据 部分相同 查询结果 查询效率 查询优化 局部结果 拓扑关系 系统性能 应用过程 最终结果 分解 图结构 有效地 子结构 剪枝 整合 匹配 发送 返回 共享 | ||
1.一种联邦型分布式RDF数据库上的多查询优化方法,其特征在于,包括如下步骤:
1)将接收到的每个SPARQL查询进行分解;
2)为1)中分解好的每个三元组模式选择数据源,利用基于SPARQL查询图结构与联邦型RDF数据库中数据源的拓扑关系的方法对数据源进行剪枝;
3)将属于相同RDF数据源并且拥有相同子结构的三元组模式重写成相应的SPARQL查询;
4)将重写查询发送到相应RDF数据源的SPARQL查询接口,得到部分本地查询匹配;
5)利用本地查询匹配进一步优化查询,发送优化后的查询到相应RDF数据源的SPARQL查询接口以得到查询结果;
6)将重写查询的部分相同计算整合在一起,共享这些相同匹配的局部结果;
7)返回每个SPARQL查询的本地查询匹配进行连接后的最终结果。
2.如权利要求1所述的一种联邦型分布式RDF数据库上的多查询优化方法,其特征在于,用户发送一组SPARQL查询,Q1,Q2,...,Qn,其中n为SPARQL查询总数。一个SPARQL查询可以被视为一个基础图模型Q,Q表示为{V(Q),E(Q),L},V(G)是RDF图G的全部顶点,VVar是一组查询变量;是Q上有向边的集合;L是边标签的集合,包括变量和属性。一个三元组模式可以被视为图中包含了两个顶点的一条边,一个SPARQL查询可以被分解为一个或多个三元组模式。在查询分解阶段,将用户输入的SPARQL查询Q分解成若干子查询{q1,q2,...,qm},其中m为SPARQL查询中的三元组模式总数。
3.如权利要求1所述的一种联邦型分布式RDF数据库上的多查询优化方法,其特征在于,在数据源选择阶段,根据SPARQL查询图结构与联邦型RDF数据库中数据源的拓扑关系对每个子查询所涉及的RDF数据源进行剪枝,排除那些无关联的数据源。将每个子查询qi(0<i≤m)与它的相关RDF数据源集合S(qi)结合起来表示成qi@S(qi),称之为qi在S(qi)上的本地查询。根据数据源拓扑关系图,如果一个SPARQL查询所属的全部数据源之间不连通,那么,这个SPARQL查询的结果为空;如果一个SPARQL查询包含的全部数据源中,存在一个数据源与其他相互关联的数据源之间不存在一条或一条以上的连通边,则可以将这个数据源剪枝。
4.如权利要求1所述的一种联邦型分布式RDF数据库上的多查询优化方法,其特征在于,属于一系列相同RDF数据源并且拥有至少一个相似子结构的三元组模式可以被分为同一组,每组三元组模式合并重写为相应的一个SPARQL查询,同一组中的三元组模式可能来自不同的SPARQL查询。
5.如权利要求4所述的一种联邦型分布式RDF数据库上的多查询优化方法,其特征在于,提供了多种重写规则,结合SPARQL查询语义中的UNION、FILTER这两种操作符来重写查询。
6.如权利要求1所述的一种联邦型分布式RDF数据库上的多查询优化方法,其特征在于,利用SPARQL查询和重写查询之间的存在变量的对应关系,本发明提供了一种新的连接优化方法,即基于重写的连接方法。此方法主要分为两个部分:基于VALUES操作符优化重写查询、公共子查询匹配。
7.如权利要求1所述的一种联邦型分布式RDF数据库上的多查询优化方法,其特征在于,通过优先发送选择性低的重写SPARQL查询至RDF数据源的查询接口,返回的部分本地查询匹配用于结合VALUES操作符来优化后面与其相关的选择性高的查询。
8.如权利要求1所述的一种联邦型分布式RDF数据库上的多查询优化方法,其特征在于,通过扩展现有的频繁子结构挖掘算法,不断找出不同的重写SPARQL查询中的公共子查询,这些公共子查询通常属于相同的SPARQL查询,将这些公共子查询的本地查询匹配进行局部匹配。
9.如权利要求1所述的一种联邦型分布式RDF数据库上的多查询优化方法,其特征在于,将本地查询匹配返回到各个SPARQL查询,对每个SPARQL查询的查询匹配进行连接,依次返回每个SPARQL查询的最终查询结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910000166.6/1.html,转载请声明来源钻瓜专利网。