[发明专利]在RDF数据集上进行OPTIONAL查询的方法及存储介质有效
申请号: | 201810995475.7 | 申请日: | 2018-08-29 |
公开(公告)号: | CN109063191B | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 陈榕;王宁;陈海波;臧斌宇;管海兵 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/242;G06F16/2455 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 庄文莉 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | rdf 数据 进行 optional 查询 方法 存储 介质 | ||
本发明提供了一种在RDF数据集上进行OPTIONAL查询的方法,将RDF数据集加载到内存,与客户端建立网络通信,接收含OPTIONAL查询的查询请求;解析查询请求,将查询请求中的查询语句分解成主查询和OPTIONAL查询两部分;执行主查询,产生主查询结果;执行OPTIONAL查询的分组查询,产生分组查询结果,汇总分组查询结果得到OPTIONAL查询结果,将主查询结果、OPTIONAL查询结果结合形成最终查询结果,将最终查询结果发送客户端。本发明提出的在RDF数据集上进行OPTIONAL查询的方法,通过建立OPTIONAL匹配表,标记OPTIONAL变量,调整查询语句顺序,动态修正查询结果等技术,极大地提高了OPTIONAL查询效率,显著降低了查询处理的开销,加快了查询速度。
技术领域
本发明涉及RDF图查询领域,具体地,涉及一种在RDF数据集上进行OPTIONAL查询的方法。
背景技术
人类正处于大数据时代,各种类型的海量数据需要以合适的形式被存储和使用。许多知识图谱、社交网络数据通常以RDF(Resource Description Framework,资源描述框架)的形式进行存储。RDF是W3C(The World Wide Web Consortium,万维网联盟)推荐使用的一种数据标准模型,它可以方便地表示万维网上的结构性数据。在RDF模型中,相互关联的数据可以表示为三元组(triple)。一个三元组由主体(subject),谓词(predicate),客体(object)构成。例如,利用RDF模型,我们可以方便地存储“上海交通大学位于上海市”这条数据。其中“上海交通大学”是三元组的主体,“位于”是谓词,“上海市”是客体。若把主体和客体看作顶点,谓词看作一条边,则三元组可以表示为以谓词连接主体顶点和客体顶点的一个有向图。整个RDF数据集可以看作一张错综复杂,顶点之间以各种谓词连接的有向图。
SPARQL(Simple Protocol and RDF Query Language)是一种对RDF数据进行查询的语言。SPARQL查询由多条查询语句组成。查询语句形如RDF中的三元组,三元组中的主体,谓词或客体以要查询的变量替换。对于一条SPARQL语句,若语句中的已知元素(主体,谓词或客体中的一个或多个)与一个RDF三元组中对应的元素一致,则称这条数据与这个查询语句“匹配”。与语句中的变量对应的数据元素即为这条语句的查询结果。
对于基础的SPARQL查询来说,语句之间的关系类似于SQL中的联接(join)。例如,语句1执行后产生中间结果1,以中间结果1中的每一条数据为基础执行语句2,若该条中间结果与语句2不匹配,则该条数据不会出现在此句结束后的中间结果2中。本说明书中,我们将基础的SPARQL查询称为“主查询”。
而对于OPTIONAL查询来说,语句之间的关系类似于SQL中的左外联接(left outerjoin)。例如,语句1执行后产生中间结果1,以中间结果1中的每一条数据为基础执行语句2,若该条中间结果与语句2不匹配,该条数据仍然会出现在此句结束后的中间结果2中,只是对于语句2所要求查询的变量,本说明书中称为OPTIONAL变量,将以一个空值代替。
一条带有OPTIONAL的SPARQL查询通常由两部分组成:主查询和OPTIONAL查询。主查询可以包含零至多条查询语句,用花括号包围起来。紧跟主查询的是一至多个OPTIONAL查询组,每个OPTIONAL查询组由一个OPTIONAL关键词标记并用花括号将查询语句包围起来。每个查询组中包含零至多条查询语句。
传统的SPARQL查询引擎没有考虑到RDF图结构数据的特点,导致需要最终联接(final join)的方式生成结果,开销极大。对于基础SPARQL查询,存在图探索的查询方法,避免了最终联接,效率较高。然而,由于OPTIONAL查询不删除不匹配的中间结果的特殊性质,使得图探索技术无法应用到OPTIONAL查询中。如何发明一种高效的OPTIONAL查询方法,成为当前图查询领域的技术难题。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810995475.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于处理数据序列的方法和装置
- 下一篇:一种高性能海量文件存储系统工作方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置