[发明专利]XML关键字检索的最低公共祖先快速查找方法无效

申请号：	200810200674.0	申请日：	2008-09-27
公开（公告）号：	CN101364234A	公开（公告）日：	2009-02-11
发明（设计）人：	周傲英;谢涛;王晓玲	申请（专利权）人：	复旦大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	上海东亚专利商标代理有限公司	代理人：	罗习群
地址：	200433***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	xml 关键字检索最低公共祖先快速查找方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1、一种XML关键字检索的最低公共祖先快速查找方法，其特征是，该方法首先进行预处理，预处理的具体步骤是：

步骤1，在解析XML文档的过程中，构建欧拉序列E和深度序列L，记录XML文档中每个结点的开始位置，结束位置和深度信息，对XML文档进行序列化，并在处理文本信息的时候，建立倒排表记录每个单词；

步骤2，将深度序列L按长度logn/2划分成2n/logn个块，在每个块上选取最小值组成一个长度为2n/logn的新序列，利用新序列建立SparseTable；

步骤3，枚举每个等价块，计算并存储块内任意序号间最小值的位置。

2、根据权利要求1所述的XML关键字检索的最低公共祖先快速查找方法，在预处理方法中，是在计算两个结点的LCA结点时，先判断两个结点是否在同一个块中，如果在同一个块中，直接取出相应等价块中两个结点的间最小值的位置，如果不是，则分别求解在新序列上的最小值和块内的最小值。

3、根据权利要求1或2所述的XML关键字检索的最低公共祖先快速查找方法，其特征在于，采用预处理后的文档结构，对XML进行关键字进行检索，给定k个关键字结点集S₁，S₂，…，S_k，检索的方法如下：

步骤1，求出结点集最小的关键字集合，假设为S₁，作为SLCA结点的候选结点集；

步骤2，对候选结点集进行k-1次迭代，每次迭代对候选结点集和另一个关键字结点集进行SLCA结点的计算，并将结果集作为下一次迭代的候选集；

步骤3，在经过k-1次迭代后，得到k个集合的SLCA结点集，其中SLCA结点计算得出候选slca结点，然后删除所有非SLCA结点。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于复旦大学，未经复旦大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200810200674.0/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载