[发明专利]一种RDF流数据和关系数据的联邦查询处理系统及方法在审
申请号: | 201810838560.2 | 申请日: | 2018-07-27 |
公开(公告)号: | CN109241155A | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 赵博;张小旺;饶国政;冯志勇 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/28 |
代理公司: | 天津盛理知识产权代理有限公司 12209 | 代理人: | 王利文 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 连接模块 查询处理模块 流数据 输出端 查询处理系统 查询解析器 关系数据 通用 关系型数据 查询结果 技术特点 连接过程 查询 | ||
本发明涉及一种RDF流数据和关系数据的联邦查询处理系统及方法,其技术特点在于:包括查询解析器模块、通用流查询处理模块、SQL查询执行模块和连接模块;所述查询解析器模块的输出端分别与通用流查询处理模块和SQL查询执行模块相连接,所述通用流查询处理模块的输出端与连接模块相连接,所述SQL查询执行模块的输出端与连接模块相连接,所述连接模块用于执行连接过程,得到最终需要的查询结果。本发明可以支持对RDF流数据和关系型数据的联邦查询。
技术领域
本发明属于异构数据库查询技术领域,涉及异构数据库的联邦查询处理方法,尤其是一种RDF流数据和关系数据的联邦查询处理系统及方法。
背景技术
目前,资源描述框架RDF(resource description framework)是由WWW提出的对万维网(World Wide Web)上信息进行描述的一个框架,它为Web上的各种应用提供信息描述规范。RDF用主语s(subject)、谓词p(predicate)、宾语o(object)的三元组形式来描述Web上的资源。其中,主语一般用统一资源标识符URI(uniform resource identifiers)表示Web上的信息实体(或者概念),谓词描述实体所具有的相关属性,宾语为对应的属性值。这样的表述方式使得RDF可以用来表示Web上的任何被标识的信息,并且使得它可以在应用程序之间交换而不丧失语义信息。SPARQL(SPARQL Protocol and RDF Query Language)是为RDF开发的一种查询语言和数据获取协议。
RDF流作为一种新型的数据集,可以在广泛的应用中为实时和连续的信息建模,例如,环境监测,智能城市等。但是数据流是时变数据元素的无界序列,难以存储,且处理需求高。当今存在的许多处理引擎都是针对静态RDF数据,但是针对RDF流数据的处理引擎很少,且都是基于集中式的处理方式,难以满足大规模RDF流数据处理的需求。
(1)连续查询
由于流数据的信息是不断更新,传统的一次查询方法是不适合的。事实上,当新的RDF流元组到达时,动态信息的查询应该重新执行。我们将这种查询看作连续查询,当前主流的连续查询语言包括三种、即C-SPARQL(Continuous SPARQL)、CQELS(Continuous QueryEvaluation over Linked Streams)和EP-SPARQL(Event Processing SPARQL)。C-SPARQL通过添加新的运算符来扩展SPARQL语言,从而支持RDF流数据的处理。CQELS则更加偏重于多源RDF流数据的处理,EP-SPARQL则偏向于复杂事件处理。这三种语言具有各自的优势,但是由于实现上的差异,使得我们难以在统一的环境下对它们进行比较和查询处理,且他们都是采用集中式的方式进行处理,处理效率有限,这限制了它们的实际应用。如何在统一的框架下对这三种查询语言进行统一处理成为了一个很重要的研究问题。
(2)关系查询
关系型数据库,是采用了关系模型来组织数据的数据库,典型的如SQL server(Structured Query Language server),为了查询关系型数据,提出了一种关系查询语言SQL(Structured Query Language),SQL可以很好的支持关系数据的查询,但是在当前数据分析需求背景下,异构数据库(RDF流数据和关系数据)的联合查询尤为重要,但是SQL只能支持关系数据库的查询,在应用上存在着局限性。
目前,RDF流数据和关系型数据的联邦查询是一个很重要的问题。然而当前对这一问题的研究十分缺乏。基于这一现状,我们提出了一种RDF流数据和关系数据的联邦查询处理方法,并基于该查询方法设计和实现了联邦查询框架。通过该框架,实现了RDF流数据和关系型数据的联邦查询。
发明内容
本发明的目的在于克服现有技术中的缺陷,提供一种设计合理、查询效率高的RDF流数据和关系数据的联邦查询处理系统及方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810838560.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种异构数据库集成接入方法
- 下一篇:用于规则管理的数据源自定义方法以及装置