[发明专利]XML关键字检索的最低公共祖先快速查找方法无效

专利信息
申请号: 200810200674.0 申请日: 2008-09-27
公开(公告)号: CN101364234A 公开(公告)日: 2009-02-11
发明(设计)人: 周傲英;谢涛;王晓玲 申请(专利权)人: 复旦大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海东亚专利商标代理有限公司 代理人: 罗习群
地址: 200433*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: xml 关键字 检索 最低 公共 祖先 快速 查找 方法
【权利要求书】:

1、一种XML关键字检索的最低公共祖先快速查找方法,其特征是,该方法首先进行预处理,预处理的具体步骤是:

步骤1,在解析XML文档的过程中,构建欧拉序列E和深度序列L,记录XML文档中每个结点的开始位置,结束位置和深度信息,对XML文档进行序列化,并在处理文本信息的时候,建立倒排表记录每个单词;

步骤2,将深度序列L按长度logn/2划分成2n/logn个块,在每个块上选取最小值组成一个长度为2n/logn的新序列,利用新序列建立SparseTable;

步骤3,枚举每个等价块,计算并存储块内任意序号间最小值的位置。

2、根据权利要求1所述的XML关键字检索的最低公共祖先快速查找方法,在预处理方法中,是在计算两个结点的LCA结点时,先判断两个结点是否在同一个块中,如果在同一个块中,直接取出相应等价块中两个结点的间最小值的位置,如果不是,则分别求解在新序列上的最小值和块内的最小值。

3、根据权利要求1或2所述的XML关键字检索的最低公共祖先快速查找方法,其特征在于,采用预处理后的文档结构,对XML进行关键字进行检索,给定k个关键字结点集S1,S2,…,Sk,检索的方法如下:

步骤1,求出结点集最小的关键字集合,假设为S1,作为SLCA结点的候选结点集;

步骤2,对候选结点集进行k-1次迭代,每次迭代对候选结点集和另一个关键字结点集进行SLCA结点的计算,并将结果集作为下一次迭代的候选集;

步骤3,在经过k-1次迭代后,得到k个集合的SLCA结点集,其中SLCA结点计算得出候选slca结点,然后删除所有非SLCA结点。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810200674.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top