[发明专利]XPath查询优化方法及系统有效
申请号: | 201210411505.8 | 申请日: | 2012-10-24 |
公开(公告)号: | CN102929996A | 公开(公告)日: | 2013-02-13 |
发明(设计)人: | 李东;梁晓翀 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 蔡茂略 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | xpath 查询 优化 方法 系统 | ||
1.一种XPath查询优化方法,其特征在于,包括下述步骤:
S101、初始化代价估算矩阵;
S102、处理单步路径;
S103、判断是否存在未估算路径,如果是,则进入步骤S104;如果否,则进入步骤S115;
S104、判断路径类型,若判断得到当前路径为长路径,则进入步骤105,若是谓词路径,则进入步骤110;
S105、判断是否存在下一种可能的连接;对于长度大于1的长路径来说,任意的路径Stepi/…/Stepj,都能将其看成由两个子路径Stepi/…/Stepk和Stepk+1/…/Stepj连接而成,其中i<=k<j,因此该路径共有j-i种连接,k初始为i,每循环一次加1,至j-1结束,若i<=k<j时下一步进入步骤S106,估算该路径在当前连接下消耗的代价;当k=j时表示已遍历完该路径所有可能的连接情况,进入步骤S109估算该路径的结果集和结果集规模;
S106、利用文档统计信息估算长路径代价;
S107、判断是否最优连接;即判断上一步骤计算所得的长路径执行代价是否小于已记录于代价估算矩阵中的最小执行代价cost,若为真则进入步骤108,记录当前连接的信息,否则无需记录任何信息,返回步骤S105;
S108、用最优连接和代价更新代价估算矩阵;进入步骤S108则表示当前路径在k处的分割为代价最小的连接方式,因此在代价估算矩阵中更新最小执行代价cost和最优连接分割点splitIndex,其中splitIndex=k;
S109、利用文档统计信息估算结果集,更新结果集矩阵;
S110、判断是否存在下一种可能的排列;
S111、利用文档统计信息估算谓词路径代价;
S112、判断是否最优排列;判断步骤S111计算所得的谓词路径执行代价是否小于已记录于代价估算矩阵中的最小执行代价cost,若为真则进入步骤S113,记录当前谓词排列顺序的信息,否则无需记录任何信息,返回步骤S110;
S113、更新代价矩阵和结果集矩阵,记录最优排列;进入步骤S108则表示当前谓词排列顺序为目前代价最小的排列方式,因此在代价估算矩阵中更新最小执行代价cost,并记录下当前的谓词排列顺序,以便后面的步骤按此顺序重新排列谓词;
S114:按步骤S113记录的谓词排列顺序来重新排列谓词;
S115:重构查询计划。
2.根据权利要求1所述的XPath查询优化方法,其特征在于,步骤S101中,初始化的具体步骤为:使用查询代价矩阵作为运行时的数据结构,在其中保存代价指标、连接位置和中间结果集的信息;查询代价矩阵中的每一个单元格s[i,j],1<=i<=j<=N,分别记录了其对应的一个部分路径SP=Stepi/.../Stepj的相关信息,用一个四元组<cost,splitIndex,hidList,rsCount>来表示,其中cost表示为完成该部分路径的查询处理,所消耗的总代价;rsCount表示该部分路径的选择度,即对该部分路径执行查询处理后的中间结果集规模;splitIndex记录该部分路径的最佳分割位置,即在该点将路径表达式分成两部分分别查询后再对两部分的结果集进行连接操作能获得最快的处理速度;hidList是完成当前子路径的查询处理后得到的结果集,即层次编码五元组列表。
3.根据权利要求2所述的XPath查询优化方法,其特征在于,步骤S102中,处理单步路径具体为:对于单步路径,不需要进行操作可直接获得目标结点集,所以将单步路径的代价cost为零;单步路径无需也无法进行连接顺序的选择,所以分割位置splitIndex设为其自身;hidList即为该标签名对应的层次编码五元组列表,rsCount即为标签对应的节点个数,通过对hidList中的nodeCount字段求和得到。
4.根据权利要求1所述的XPath查询优化方法,其特征在于,步骤S105中,判断路径类型的步骤是:定义谓词路径为只包含谓词过滤操作符,不包含其它类型操作符的路径表达式,遍历当前处理路径的操作符集合,如果存在除谓词操作符以外的其它类型的操作符,则当前处理路径为长路径,如果不存在,当前处理路径为谓词路径。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210411505.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种柔软耐磨吸湿面料
- 下一篇:适于风噪声抑制的助听器