[发明专利]XML关键字检索的最低公共祖先快速查找方法无效
申请号: | 200810200674.0 | 申请日: | 2008-09-27 |
公开(公告)号: | CN101364234A | 公开(公告)日: | 2009-02-11 |
发明(设计)人: | 周傲英;谢涛;王晓玲 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海东亚专利商标代理有限公司 | 代理人: | 罗习群 |
地址: | 200433*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | xml 关键字 检索 最低 公共 祖先 快速 查找 方法 | ||
1、一种XML关键字检索的最低公共祖先快速查找方法,其特征是,该方法首先进行预处理,预处理的具体步骤是:
步骤1,在解析XML文档的过程中,构建欧拉序列E和深度序列L,记录XML文档中每个结点的开始位置,结束位置和深度信息,对XML文档进行序列化,并在处理文本信息的时候,建立倒排表记录每个单词;
步骤2,将深度序列L按长度logn/2划分成2n/logn个块,在每个块上选取最小值组成一个长度为2n/logn的新序列,利用新序列建立SparseTable;
步骤3,枚举每个等价块,计算并存储块内任意序号间最小值的位置。
2、根据权利要求1所述的XML关键字检索的最低公共祖先快速查找方法,在预处理方法中,是在计算两个结点的LCA结点时,先判断两个结点是否在同一个块中,如果在同一个块中,直接取出相应等价块中两个结点的间最小值的位置,如果不是,则分别求解在新序列上的最小值和块内的最小值。
3、根据权利要求1或2所述的XML关键字检索的最低公共祖先快速查找方法,其特征在于,采用预处理后的文档结构,对XML进行关键字进行检索,给定k个关键字结点集S1,S2,…,Sk,检索的方法如下:
步骤1,求出结点集最小的关键字集合,假设为S1,作为SLCA结点的候选结点集;
步骤2,对候选结点集进行k-1次迭代,每次迭代对候选结点集和另一个关键字结点集进行SLCA结点的计算,并将结果集作为下一次迭代的候选集;
步骤3,在经过k-1次迭代后,得到k个集合的SLCA结点集,其中SLCA结点计算得出候选slca结点,然后删除所有非SLCA结点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810200674.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于栓剂灌封机的垂直多头灌注机构
- 下一篇:一种井径传感器的检测装置