[发明专利]在RDF数据集上进行OPTIONAL查询的方法及存储介质有效

专利信息
申请号: 201810995475.7 申请日: 2018-08-29
公开(公告)号: CN109063191B 公开(公告)日: 2021-07-06
发明(设计)人: 陈榕;王宁;陈海波;臧斌宇;管海兵 申请(专利权)人: 上海交通大学
主分类号: G06F16/22 分类号: G06F16/22;G06F16/242;G06F16/2455
代理公司: 上海汉声知识产权代理有限公司 31236 代理人: 庄文莉
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: rdf 数据 进行 optional 查询 方法 存储 介质
【说明书】:

发明提供了一种在RDF数据集上进行OPTIONAL查询的方法,将RDF数据集加载到内存,与客户端建立网络通信,接收含OPTIONAL查询的查询请求;解析查询请求,将查询请求中的查询语句分解成主查询和OPTIONAL查询两部分;执行主查询,产生主查询结果;执行OPTIONAL查询的分组查询,产生分组查询结果,汇总分组查询结果得到OPTIONAL查询结果,将主查询结果、OPTIONAL查询结果结合形成最终查询结果,将最终查询结果发送客户端。本发明提出的在RDF数据集上进行OPTIONAL查询的方法,通过建立OPTIONAL匹配表,标记OPTIONAL变量,调整查询语句顺序,动态修正查询结果等技术,极大地提高了OPTIONAL查询效率,显著降低了查询处理的开销,加快了查询速度。

技术领域

本发明涉及RDF图查询领域,具体地,涉及一种在RDF数据集上进行OPTIONAL查询的方法。

背景技术

人类正处于大数据时代,各种类型的海量数据需要以合适的形式被存储和使用。许多知识图谱、社交网络数据通常以RDF(Resource Description Framework,资源描述框架)的形式进行存储。RDF是W3C(The World Wide Web Consortium,万维网联盟)推荐使用的一种数据标准模型,它可以方便地表示万维网上的结构性数据。在RDF模型中,相互关联的数据可以表示为三元组(triple)。一个三元组由主体(subject),谓词(predicate),客体(object)构成。例如,利用RDF模型,我们可以方便地存储“上海交通大学位于上海市”这条数据。其中“上海交通大学”是三元组的主体,“位于”是谓词,“上海市”是客体。若把主体和客体看作顶点,谓词看作一条边,则三元组可以表示为以谓词连接主体顶点和客体顶点的一个有向图。整个RDF数据集可以看作一张错综复杂,顶点之间以各种谓词连接的有向图。

SPARQL(Simple Protocol and RDF Query Language)是一种对RDF数据进行查询的语言。SPARQL查询由多条查询语句组成。查询语句形如RDF中的三元组,三元组中的主体,谓词或客体以要查询的变量替换。对于一条SPARQL语句,若语句中的已知元素(主体,谓词或客体中的一个或多个)与一个RDF三元组中对应的元素一致,则称这条数据与这个查询语句“匹配”。与语句中的变量对应的数据元素即为这条语句的查询结果。

对于基础的SPARQL查询来说,语句之间的关系类似于SQL中的联接(join)。例如,语句1执行后产生中间结果1,以中间结果1中的每一条数据为基础执行语句2,若该条中间结果与语句2不匹配,则该条数据不会出现在此句结束后的中间结果2中。本说明书中,我们将基础的SPARQL查询称为“主查询”。

而对于OPTIONAL查询来说,语句之间的关系类似于SQL中的左外联接(left outerjoin)。例如,语句1执行后产生中间结果1,以中间结果1中的每一条数据为基础执行语句2,若该条中间结果与语句2不匹配,该条数据仍然会出现在此句结束后的中间结果2中,只是对于语句2所要求查询的变量,本说明书中称为OPTIONAL变量,将以一个空值代替。

一条带有OPTIONAL的SPARQL查询通常由两部分组成:主查询和OPTIONAL查询。主查询可以包含零至多条查询语句,用花括号包围起来。紧跟主查询的是一至多个OPTIONAL查询组,每个OPTIONAL查询组由一个OPTIONAL关键词标记并用花括号将查询语句包围起来。每个查询组中包含零至多条查询语句。

传统的SPARQL查询引擎没有考虑到RDF图结构数据的特点,导致需要最终联接(final join)的方式生成结果,开销极大。对于基础SPARQL查询,存在图探索的查询方法,避免了最终联接,效率较高。然而,由于OPTIONAL查询不删除不匹配的中间结果的特殊性质,使得图探索技术无法应用到OPTIONAL查询中。如何发明一种高效的OPTIONAL查询方法,成为当前图查询领域的技术难题。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810995475.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top