[发明专利]一种基于关系数据库的XML数据在存储方法在审
申请号: | 201410533648.5 | 申请日: | 2014-10-11 |
公开(公告)号: | CN105574007A | 公开(公告)日: | 2016-05-11 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 镇江鼎拓科技信息有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 212009 江苏省镇江市镇*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关系 数据库 xml 数据 存储 方法 | ||
技术领域
一种基于关系数据库的XML数据在存储方法主要涉及计算机数据存储领域。
背景技术
XML是ExtensibleMarkupLanguage的缩写,XML数据的可扩展性和自我描述性使得它成为当前网络上数据传输的主要形式,但是它对数据的处理能力却相当的有限,实现XML存储为关系数据库以后,就可以利用关系数据库所带有的存储管理等技术来处理XML数据,所以把XML转换为关系数据库存储方式是很有研究价值的。通过对XML数据在关系数据库中的存储方法的研究,发现基于DTD的存储方法不能够适应XML文档以XMLSchema为标准的趋势[1],伯哈农存储方法的搜索算法不够高效且转换规则存在一些漏洞等问题。因此,本文提出了一种全面的存储方法。
发明内容
通过国家专利检索没有发现关于此系统方面的申请资料。
由于关系数据是一种结构化的数据,它以扁平的二维关系表存储在关系数据库,而XML数据是半结构化的,所以要实现存储,必需进行模式映射[2]。大多XML文档是基于DTD(DocumentTypeDefinition)模式,因此这里从DTD开始着手对数据的转化。
主要方未能如下:
(1)由于XMLSchema已成为XML文档定义的大势所趋,所以先把DTD转化成XMLSchema,实现XML文档定义的标准化。
(2)转换XMLSchema为DOM树模型。
(3)利用不同的规则生成全部的模式空间,再利用哈希连接算法生成的模型来进行评估,找出最优的查询代价模式。
(4)利用选择算法搜索出最优的模式,但是这个模式还不是关系模式,需要通过规则并且利用DOM树把它映射为关系模式。
2.2存储方法的具体步骤
2.2.1XMLDTD到XMLSchema的转换过程
本文实现的XMLDTD到XMLschema的转化工具[3]是一个公开的C#类,类名为FiSchemaOutPutFromDTD,通过此类中的四种方法可以实现从XMLDTD到XMLSchema的转换。
2.2.2生成初始模式
利用DOM树文档模式的生成算法,产生DOM树文档模式,也就是模式空间的初始模式,算法如下:
初始化DOM树文档模式为空;
while(XMLSchema中当前访问元素不为空)do
{
switch(当前访问的元素)
{
case复杂元素:为该复杂元素创建新的类型并标注为已访问;
break;
case多值元素:为该多值元素创建新的类型并标注为己访问;
break;
case可选元素:为该可选元素创建新的类型并标注为已访问;
break;
default:在DOM树文档模式中增加该元素,标注该元素已访问;
break;
}
访问XMLSchema中的下一个元素;
}
2.2.3代价模型的生成
以上述过程所得到的DOM初始模式为基础,我们通过垂直分割、垂直合并、水平分割、水平合并、“|上浮”和“|下移”[4]这6种模式转换操作产生所有的模式,即模式空间。其中每一个模式都对应着关系数据库中的一个存储方案,就要从中挑选出一个最合适的,而衡量是否合适的标准就是建立查询代价基础之上的,与其它的代价模型相比,哈希连接算法的连接代价较小,这里引入一个基于哈希连接算法的代价模型[5]COSThash=3(|Rl|+|R2|)+SP1·SP2·|R1|,通过它计算出代价模型。
2.2.4关系模式的生成
现在可以生成所有的模式,又存在代价模型,剩下的任务就是把前两者组织在一起并且选优,即从这么多的模式中选出一个最优的模式。本文采用的模式搜索算法的中心思想是把整个模式空间按内存大小分成若干组,首先把生成的第一组模式载入内存,从中选出一个代价较小的模式,然后把这个模式及其对应的代价记录下来,接着把第二组模式载入内存,从中选出一个代价最小的模式,让这个模式与第一组生成的模式进行代价比较,记录较小者,依次类推,直至模式空间生成完毕,最后得出代价最小的模式,即:最优模式。
得到了最优模式以后,利用如下算法将其映射为关系模式。
函数:将最优中间模式映射为关系模式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于镇江鼎拓科技信息有限公司,未经镇江鼎拓科技信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410533648.5/2.html,转载请声明来源钻瓜专利网。