[发明专利]一种基于连接代价的SPARQL语义数据查询优化方法在审
申请号: | 201510288922.1 | 申请日: | 2015-05-29 |
公开(公告)号: | CN104834754A | 公开(公告)日: | 2015-08-12 |
发明(设计)人: | 徐雷;方卿;袁小群 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 张火春 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 连接 代价 sparql 语义 数据 查询 优化 方法 | ||
1.一种基于连接代价的SPARQL语义数据查询优化方法,其特征在于,包括如下步骤:
步骤1:构建RDF语义数据索引,使用B树结构对RDF语义数据进行索引存储,选择spo、pos、osp三种索引方式;其中,s为主语、p为谓语、o为宾语;
步骤2:获取用户客户端提交的SPARQL查询语句,解析出SPARQL查询语句中的图模式,并表示为SPARQL连接图形式;
步骤3:利用RDF模式信息简化SPARQL查询语句,得到简化的SPARQL连接图;
步骤4:估计SPARQL查询语句子查询结果的基数大小cart(t);使用公式cart(t)=3×N/4进行估计,其中N表示子查询经过哈希运算后结果集个数的取值范围;t表示SPARQL查询语句中的一个子查询,对应精简后的SPARQL连接图中的一个节点;子查询是指SPARQL连接图模式中的一条三元组查询;
步骤5:对连接操作的结果集大小进行估计;
步骤6:根据步骤5得到的连接操作的结果集大小的估计值,使用动态规划方法在整个连接图空间中查找最优的执行顺序。
步骤7:根据最佳执行顺序,产生新的SPARQL查询并提交服务器端执行语义查询;
步骤8:结束。
2.根据权利要求1所述的一种基于连接代价的SPARQL语义数据查询优化方法,其特征在于,所述的步骤3中利用RDF模式信息简化SPARQL查询语句;的具体精简规则为:
①对含有公共变量的SPARQL连接图模式{?x rdf:type C1.?x rdf:type C2.……}简化为{?x rdf:type C1.……},其中,C1和C2是RDF中的概念,?x表示待查询的变量;
②对于{?x rdf:type C1.?x p o.……}的SPARQL连接图模式,其中p为非rdf:type类型的属性,简化为{?x p o.……},o为宾语;使用该规则时,根据模式信息考察谓语p的定义域或值域是否为单个概念,如果是,直接按该规则简化,如果不是,SPARQL连接图模式将不进行简化处理;
③对于含有公共变量形{?x p1?o.?y p2?o.……}的图模式,其中p 1是p 2的子属性,简化为{?x p1?o.……}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510288922.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:提取发动机缸孔各阶次变形的处理方法
- 下一篇:人脉关系的展示与搜索