[发明专利]基于关系代数范围运算的XML数据库查询方法无效
申请号: | 200710168709.2 | 申请日: | 2007-12-07 |
公开(公告)号: | CN101183376A | 公开(公告)日: | 2008-05-21 |
发明(设计)人: | 周英彪;徐小双 | 申请(专利权)人: | 武汉达梦数据库有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 武汉开元专利代理有限责任公司 | 代理人: | 潘杰 |
地址: | 430073湖北省武汉*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 关系 代数 范围 运算 xml 数据库 查询 方法 | ||
技术领域
本发明属于计算机中的数据库应用技术领域,特别是一种基于关系代数范围运算的XML数据库查询方法。
背景技术
随着互连网的迅速发展,WEB页面正在以惊人的速度增长。作为WEB的基础语言,HTML取得了很大成功。但HTML固定标签集的缺点在于缺乏扩展性,无法支持各种领域种类繁多的数据。为此W3C开始制订XML标准,目标是具有扩展性、结构性和有效性的标记语言。
目前,XML已经在许多领域得到了广泛应用,如模式设计、内容管理、数据集成等等。作为定义、存储和交换数据的有效工具,XML技术与数据库技术也正在相互融合,XML数据库适合管理复杂数据结构的数据集,如果已经以XML格式存储信息,则XML数据库利于文档存储和检索;可以用方便实用的方式检索文档,并能够提供高质量的全文搜索引擎。特别适合对半结构化数据的管理。另外XML数据库能够存储和查询异种的文档结构,提供对异种信息存取的支持。
作为数据存储、定义、交换和共享的平台,XML文档是一种层次结构,很自然的,我们用文档树来描述XML文档。文档树中包含根节点、元素节点、属性节点、文本节点、注释节点、处理指令、命名空间节点等。XPath是一种轻量的XML查询语言,也是其他XML查询语言如XQuery、XSLT的基础,它通过带有搜索路径表达式来在XML文档中定位文本数据、元素、属性以及其他信息。
目前对于XPath的实现存在多种方案:基于网络层次模型的原生XML数据库,对关系数据库的扩展实现方案,数据库中间件等等。其中,对于关系数据库的扩展实现方案较好的结合了关系模型和半结构化层次模型的优点,但诸如SQL Server等流行的关系型数据库的XPath实现上依赖于字符串的匹配和LIKE运算,因为计算机在字符串运算上的效率相对于整数运算较低,所以尚存在一些性能问题,本发明以整数的范围运算为基础构建XPath查询算法,充分利用CPU整数运算性能强的特点。
所依据的技术文献和标准:
W3C Candidate Recommendation
《XQuery 1.0:An XML Query Language》
《XML Path Language(XPath)2.0》
发明内容
本发明的目的是提供一种通过整数的范围查询来实现XPath查询的基于关系代数范围运算的XML数据库查询方法,。
为了实现上述目的,本发明所采用的方法是:把XPath查询的路径表达式转化为整数的范围查询,利用B树索引有效的存储和索引XML。
上述方法的具体步骤是:
第一步骤:注册XML模式形成数据模型的标准:即数据在XML文档中应该遵循的规则,内容包括文档中允许的元素(标签)、各个元素(标签)之间的关系、可以分配给每个元素的属性、每个标签允许的数据类型(文本、其他元素、组合)等等,将XML模式进行分析,使得XML模式中的每个元素和属性节点分配一个特定的整数区间,保证各个区间之间没有交集;
第二步骤:对基于模式、良构的XML文档进行分析,得到其信息集(Infoset)结构:对于同类型的元素或属性节点根据其在XML模式中的所属类型和XML文档中的相对位置,确定对应于XML模式中的整数区间,并在此区间内分配唯一的整数标识值给当前节点,换言之,元素和属性节点的标识整数值所落在的整数范围,这样XPath查询工作的一部分就转化为整数的范围子查询;
第三步骤:根据第二步骤查询的方案,形成适应于树模型的嵌套查询,选出符合XPath树模式的最后结果集,该结果集也是一个序列。
本发明的先进性在于:利用整数的范围查询实现XML的XPath查询,因为关系引擎以B树索引为基础,采用对于主键的比较查询搜索数据,而计算机中整数的比较运算是最快的,这样的实现避免了字符串匹配运算的开销,效率很高。
附图说明
图1为本发明的系统框图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细描述,但该实施例不应理解为对本发明的限制。
B树索引是关系数据库中广泛使用的索引,如果能利用它有效存储和索引XML,将会降低关系数据库支持XML开发的难度。B树索引检索基于对于主键的比较运算,而计算机中整数的比较运算是最快的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉达梦数据库有限公司,未经武汉达梦数据库有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710168709.2/2.html,转载请声明来源钻瓜专利网。