[发明专利]一种提速的基于IPC编码的查询处理方法有效
申请号: | 201710035078.0 | 申请日: | 2017-01-17 |
公开(公告)号: | CN106909621B | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 付玺;王斌;李鹏;王卿;李雄;徐杰;马宏远 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F16/24 | 分类号: | G06F16/24;G06F16/22 |
代理公司: | 11200 北京君尚知识产权代理有限公司 | 代理人: | 邱晓锋 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种提速的基于IPC编码的查询处理方法。该方法把IPC编码下的索引文件视为树形的跳表文件,实现快读略过子树的算法;在处理布尔的求交查询时,根据链表的单调性判断是否略过(skip)某些子树,略过(skip)操作可节省大量时间从而提高线上布尔查询处理速度;在处理排序查询时,使用常见的TAAT处理方式与continue机制,根据ID列表的求交结果的位置可以快速取出对应的频率的索引文件的对应的值,通过略过所有不必要访问的子树的手段提高线上排序查询的处理速度。本发明根据IPC编码的特点优化了查询速度(包括布尔查询与排序查询),优化了检索系统的用户体验。 | ||
搜索关键词: | 一种 提速 基于 ipc 编码 查询 处理 方法 | ||
【主权项】:
1.一种提速的基于IPC编码的查询处理方法,其特征在于,包括以下步骤:/n(1)将IPC编码下的索引文件视为树形的跳表文件,在解压缩IPC编码的索引文件时实现恢复与略过算法;所述恢复与略过算法用一个存储节点信息的结构体的栈来加速实现:/n在恢复函数即restore函数里,一个节点信息结构体需要保存的项为:1)left,即该节点在当前区间左边的元素个数;2)right,即该节点在当前区间右边的元素个数;3)max,即当前区间的最大值;4)min,即当前区间的最小值;5)orgvalue,即该节点的原值;6)pos,即当前节点的位置;/n在略过函数即skip函数里,一个节点信息结构体需要保存的项为:1)left,即该节点在当前区间左边的元素个数;2)right,即该节点在当前区间右边的元素个数;3)len,即当前区间的长度;4)tmpvalue,即该节点在IPC索引文件中记录的值;/n(2)在处理布尔求交查询时,根据链表的单调性判断是否略过某些子树,通过略过操作来提高线上布尔查询处理速度;在处理布尔求交查询时,对一个已经解压的顺序列表与一个IPC编码压缩的索引列表执行快速求交算法;/n定义恢复后的数值列表保存在数列Rlr中,待恢复的列表是ls,已恢复列表是Rlr1,节点信息结构体的栈是S,并定义Rlrcur、Rlr1cur为Rlr与Rlr1上的当前指针;对于一个根为root的树,定义leftlist是root到其最左叶子节点的路径的逆路径;则所述快速求交算法包括以下步骤:/n1)恢复根节点并压入栈;/n2)当栈不为空时,取root为栈首元素并执行如下循环;/n3)如果root的原值小于Rlr1cur所指的值,则略过root的整个左子树;对root的左子树的根节点调用skip函数;/n4)如果root的原值不小于Rlr1cur所指的值,恢复root的子树下所有最左边的节点;/n5)执行如下循环;/n6)如果Rlr1cur所指的值小于或等于root的原值,那么执行第7)步,否则执行第10)步;/n7)如果Rlr1cur所指的值等于root的原值,那么把root的原值压入结果列表Rlr,Rlr上指针Rlrcur后移,无论条件是否满足,执行第8)步;/n8)如果Rlr1列表到了其边界,那么跳出函数,否则执行第9)步;/n9)Rlr1列表上指针Rlr1cur后移,返回第5)步;/n10)定义tmp是栈S的top节点的指针,并弹出栈;/n11)如果Rlr1cur所指的值小于tmp节点的leftlist下下一个节点的原值,并且tmp节点存在右孩子,那么执行第12)步,否则执行第13)步;/n12)恢复他的右孩子节点并压入栈S,回到第2)步;/n13)调用skip函数跳过其所有右子树节点,并回到第5)步;最后在列表Rlr中保存的值就是布尔与查询中求交的结果,并且在算法中实现了skip的操作;/n(3)在处理排序查询时,采用带skip的频率获取算法,根据文档ID列表的求交结果的位置快速取出对应的频率的索引文件的值,通过略过所有不需要访问的子树来提高线上排序查询的处理速度;所述带skip的频率获取算法使用TAAT处理方式,在达到累加器的上限之前,对查询词的处理采用union策略,在达到上限后,采用继续更新累加器的continue策略。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710035078.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种超高分子量聚乙烯纤维防弹板材
- 下一篇:一种防暴盾牌