[发明专利]一种基于连接代价的SPARQL语义数据查询优化方法在审

专利信息
申请号: 201510288922.1 申请日: 2015-05-29
公开(公告)号: CN104834754A 公开(公告)日: 2015-08-12
发明(设计)人: 徐雷;方卿;袁小群 申请(专利权)人: 武汉大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人: 张火春
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 连接 代价 sparql 语义 数据 查询 优化 方法
【说明书】:

技术领域

发明属于计算机查询优化技术领域,具体涉及一种基于连接代价的SPARQL语义查询优化方法。

背景技术

目前关联数据(Linked Data)的规模逐年递增,基于关联数据的语义查询的效率一直有待提高。关联数据一般采用RDF(资源描述框架)来表达,目前对RDF文档查询优化研究主要分为2个方面:一种是对RDF文档建立有效的索引机制,以及Oracle、Mysql等关系数据库对RDF文档的序列化索引机制;另一种是对RDF标准查询语言SPARQL的优化。前者主要依赖于RDF的索引结构、磁盘索引存储方式或数据库的特性来达到较高的I/O吞吐性能;后者从分析SPARQL语法语义的角度,研究其查询机制,找到最优的逻辑查询计划。SPARQL类似于SQL查询语言的select-from结构,它的执行需要相应的查询处理器进行编译。在编译过程中会进行关系代数等价转换,关系代数的等价形式有多种,各操作子的执行顺序,连接操作的代价,以及操作子的具体实现方式都有差异,所以存在对SPARQL的各种逻辑优化策略。

目前对SPARQL优化的方法中,一些是从SPARQL语句中属性相关性的角度来调整SPARQL语句中连接操作的选择度估值,以及使用自适应存储系统FlexTable来改善查询效率;还有的方法采用SPARQL语义约简规则以及选择估值策略融合的方案来设计SPARQL的优化算法;以及利用元组模式的选择度估值寻找元组模式最优连接顺序的方法,这种方法已应用于Jena的SPARQL查询优化器ARQ中;将SPARQL查询模式进行分组也是一种优化策略,还可以采用贝叶斯网和链直方图的方法进行选择度的估计来优化SPARQL查询。

发明内容

本发明在于解决海量RDF语义数据查询效率低下的问题,设计了一种基于连接代价的SPARQL语义查询优化方法。

为实现上述目标,本发明采用如下技术方案:

一种基于连接代价的SPARQL语义数据查询优化方法,包括如下步骤:

步骤1:构建RDF语义数据索引,使用B树结构对RDF语义数据进行索引存储,选择spo、pos、osp三种索引方式;其中,s为主语、p为谓语、o为宾语;

步骤2:获取用户客户端提交的SPARQL查询语句,解析出SPARQL查询语句中的图模式,并表示为SPARQL连接图形式;

步骤3:利用RDF模式信息简化SPARQL查询语句,得到简化的SPARQL连接图;

步骤4:估计SPARQL查询语句子查询结果的基数大小cart(t);使用公式cart(t)=3×N/4进行估计,其中N表示子查询经过哈希运算后结果集个数的取值范围;t表示SPARQL查询语句中的一个子查询,对应精简后的SPARQL连接图中的一个节点;子查询是指SPARQL连接图模式中的一条三元组查询;

步骤5:对连接操作的结果集大小进行估计;

步骤6:根据步骤5得到的连接操作的结果集大小的估计值,使用动态规划方法在整个连接图空间中查找最优的执行顺序。

步骤7:根据最佳执行顺序,产生新的SPARQL查询并提交服务器端执行语义查询;

步骤8:结束。

进一步的,所述的步骤3中利用RDF模式信息简化SPARQL查询语句;的具体精简规则为:

①对含有公共变量的SPARQL连接图模式{?x rdf:type C1.?x rdf:type C2.……}简化为{?x rdf:type C1.……},其中,C1和C2是RDF中的概念,?x表示待查询的变量;

②对于{?x rdf:type C1.?x p o.……}的SPARQL连接图模式,其中p为非rdf:type类型的属性,简化为{?x p o.……},o为宾语;使用该规则时,根据模式信息考察谓语p的定义域或值域是否为单个概念,如果是,直接按该规则简化,如果不是,SPARQL连接图模式将不进行简化处理;

③对于含有公共变量形{?x p1?o.?y p2?o.……}的图模式,其中p 1是p 2的子属性,简化为{?x p1?o.……}。

进一步的,所述的步骤5中使用如下方法估计连接操作结果集的基数:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510288922.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top