[发明专利]一种基于关系数据库的资源描述框架查询方法和系统有效
申请号: | 201210167775.9 | 申请日: | 2012-05-28 |
公开(公告)号: | CN102693310A | 公开(公告)日: | 2012-09-26 |
发明(设计)人: | 陈佳;吴跃;吴少智;黎明 | 申请(专利权)人: | 无锡成电科大科技发展有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 胡彬 |
地址: | 214135 江苏省无锡市无锡新*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关系 数据库 资源 描述 框架 查询 方法 系统 | ||
技术领域
本发明涉及语义网数据检索技术,具体涉及一种基于关系数据库的资源描述框架(RDF)查询方法和系统。
背景技术
语义网(Semantic Web)成为近几年来互联网发展的一个热点,代表智能网络未来的语义网是一个以知识为中心的模型。除了人类可读的文档和XML消息格式之外,它还增加了机器可以理解和处理的数据。
资源描述框架(Resource Description Framework,RDF)是描述Web资源的标准数据模型。由于Web数据的半结构化特性,RDF查询语言应该支持对半结构化数据的查询。万维网联盟(W3C)提出的SRARQL(SPARQL Protocol and RDF Query Language,SPARQL协定与RDF查询语言)语言就是这样一种针对RDF图的半结构化查询语言。
SPARQL对于语义网就像SQL对于关系数据库一样重要。SPARQL跟其他查询语言的不同之处在于它能够融合不同的异构数据源来进行查询。它基于RDF图模式进行查询,允许应用程序对分布式RDF数据库进行复杂的查询,从RDF图中查询信息,并根据要求返回不同形式的结果,并得到了互相竞争的多种框架的支持。
目前SPARQL还仅仅只是一个协议标准,没有开发出成熟的数据库系统对其进行完全的支持。考虑到SPARQL是一种沿袭传统数据库查询模式的语言,采用“select-from-where”查询模式,便于用户掌握和理解;但是它仅支持遍历查询RDF文件,其查询效率是相当低效的。而现有传统数据库在查询优化等技术方面已经相当成熟,查询数据的效率相对高效,但是其查询语言SQL不具有语义性。因此,需要在用户和关系数据库之间建立一个透明的查询引擎,接受用户提交的SPARQL查询语句并将其转换为关系数据库可以处理的SQL语句,SQL语句直接对关系数据库进行操作,最后该引擎将SQL查询结果按照SPARQL查询语句转换为用户所需的RDF查询结果;这样RDF查询语言不仅具有本身语义性的优点,而且同时具有对海量数据查询的高效性。
现有技术采用三元组(垂直表)的形式对RDF数据进行存储,这种存储方式具体实现是将RDF三元组的主语、谓语、宾语分离出来,分别存在数据库的statements表的subject、predicate、object列中。
将SPARQL转化为SQL语句后,即可使用SQL语言对存储有三元组数据的数据库进行查询。
SPARQL查询的核心是RDF图匹配方式,该方式用SPARQL查询中描述的RDF图模式来对数据库中原始RDF图数据进行完全匹配。完全匹配要求所有的RDF图分支均匹配才输出结果。SPARQL可以由很复杂的RDF图模式表示,但其中最基本的是基本RDF图模式,复杂的SPARQL查询就是在基本图模式的基础上进行一些交并操作来进行结果的选择。
汪锦岭等人提出一种采用“与或匹配树”的主顶点方式来进行高效RDF图匹配。该方法的主要思想是根据元语句中节点的深度关系来进行多次匹配。其先由与或树判断各节点的深度,避免环结构。然后将RDF图模式根基节点加入主顶点集中,然后匹配以所有主顶点集中的顶点为主语的三元组,若有匹配,则将该三元组的宾语加入主顶点集中,所有匹配尝试完以后删除原先的主顶点。如此依次循环。主要体现的是一个路径的思想,对原RDF图按路径逐级进行匹配。,但是该方法主要应用于模糊匹配或者本体推理方面会比较有效,对于SPARQL这种完全匹配方法存在一定的局限性。由于该方法在每次匹配以后需要跟主程序进行交互,并修改数据结构中的内容以生成下一轮匹配条件,过程复杂且时间开销较大,效率相对低下。
同时,Artem Chebotko等人提出的“模式树”方法针对可选图模式(optional pattern)创建了模式树,通过父子节点的关系来表示可选图模式依附的主模式。若加入并图模式,由于其子图模式不存在主从之分,无法直接在两个模式间建立这种父子关系,并且跟可选图模式无法做区分。刘静也提出过“模式树”的方法,基本上与Artem Chebotko的方法一致,但是其方法中关于平行可选图模式的理解有待讨论。
由此,亟需一种简单高效的RDF查询方法和系统使得在保持查询语言语义性的前提下提高查询效率。
发明内容
本发明的目的在于提供一套完整可行的机制来支持SPARQL查询转换成SQL查询,并将SQL语句返回的结果进行语义包装的方法和系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡成电科大科技发展有限公司,未经无锡成电科大科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210167775.9/2.html,转载请声明来源钻瓜专利网。