[发明专利]一种基于连接代价的SPARQL语义数据查询优化方法在审

专利信息
申请号: 201510288922.1 申请日: 2015-05-29
公开(公告)号: CN104834754A 公开(公告)日: 2015-08-12
发明(设计)人: 徐雷;方卿;袁小群 申请(专利权)人: 武汉大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人: 张火春
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 连接 代价 sparql 语义 数据 查询 优化 方法
【权利要求书】:

1.一种基于连接代价的SPARQL语义数据查询优化方法,其特征在于,包括如下步骤:

步骤1:构建RDF语义数据索引,使用B树结构对RDF语义数据进行索引存储,选择spo、pos、osp三种索引方式;其中,s为主语、p为谓语、o为宾语;

步骤2:获取用户客户端提交的SPARQL查询语句,解析出SPARQL查询语句中的图模式,并表示为SPARQL连接图形式;

步骤3:利用RDF模式信息简化SPARQL查询语句,得到简化的SPARQL连接图;

步骤4:估计SPARQL查询语句子查询结果的基数大小cart(t);使用公式cart(t)=3×N/4进行估计,其中N表示子查询经过哈希运算后结果集个数的取值范围;t表示SPARQL查询语句中的一个子查询,对应精简后的SPARQL连接图中的一个节点;子查询是指SPARQL连接图模式中的一条三元组查询;

步骤5:对连接操作的结果集大小进行估计;

步骤6:根据步骤5得到的连接操作的结果集大小的估计值,使用动态规划方法在整个连接图空间中查找最优的执行顺序。

步骤7:根据最佳执行顺序,产生新的SPARQL查询并提交服务器端执行语义查询;

步骤8:结束。

2.根据权利要求1所述的一种基于连接代价的SPARQL语义数据查询优化方法,其特征在于,所述的步骤3中利用RDF模式信息简化SPARQL查询语句;的具体精简规则为:

①对含有公共变量的SPARQL连接图模式{?x rdf:type C1.?x rdf:type C2.……}简化为{?x rdf:type C1.……},其中,C1和C2是RDF中的概念,?x表示待查询的变量;

②对于{?x rdf:type C1.?x p o.……}的SPARQL连接图模式,其中p为非rdf:type类型的属性,简化为{?x p o.……},o为宾语;使用该规则时,根据模式信息考察谓语p的定义域或值域是否为单个概念,如果是,直接按该规则简化,如果不是,SPARQL连接图模式将不进行简化处理;

③对于含有公共变量形{?x p1?o.?y p2?o.……}的图模式,其中p 1是p 2的子属性,简化为{?x p1?o.……}。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510288922.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top