[发明专利]一种面向微博实时搜索的自适应索引方法有效
申请号: | 201510242074.0 | 申请日: | 2015-05-13 |
公开(公告)号: | CN104834726B | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 赵峰;金海;柳俊;李少峰 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 华中科技大学专利中心42201 | 代理人: | 赵伟 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向微博实时搜索的自适应索引方法,该方法包括新建大小为π0的第0层倒排索引i0;将新的微博索引到第0层倒排索引i0;当第0层倒排索引i0空间不够时,生成第0层倒排索引i0的副本第0层副本i0`,将微博插入到清空后的第0层倒排索引i0;判断当前存在索引包的数量k<=p是否成立,若是,则创建大小为rk×π0的第k层索引包jk;若否,则创建大小为rk×π0的第k层倒排索引ik;若当前层索引空间不够,将当前层索引内容移动到下一层;监测用户查询请求到达速率的变化情况,据此对索引结构进行自适应的调整。本发明能够解决现有索引方法中存在的查询效率不高、无法适应外部动态环境的问题。 | ||
搜索关键词: | 一种 面向 实时 搜索 自适应 索引 方法 | ||
【主权项】:
一种面向微博实时搜索的自适应索引方法,其特征在于,所述方法具体如下:(1)判断是否已创建第0层倒排索引i0,若是,则进入步骤(3);若否,则创建一个空间大小为π0的第0层倒排索引i0,进入步骤(2);(2)将新的微博索引到第0层倒排索引i0;(3)判断第0层倒排索引i0里的微博数量是否达到π0,若是,则生成第0层倒排索引i0的副本即第0层副本i0`,并将第0层倒排索引i0清空,将所述新的微博插入到清空后的第0层倒排索引i0,进入步骤(4);若否,则进入步骤(2);(4)判断是否已创建第k层索引包jk,若是,则进入步骤(6);若否,则创建一个空间大小为rk×π0的第k层索引包jk,进入步骤(5);其中,索引包为一种能存放多个倒排索引的数据结构;其中,r=2~20;k=1…m,m是索引结构的总层数;(5)将第k‑1层副本ik‑1`移动到第k层索引包jk;(6)判断第k层索引包jk里的微博数量是否达到rk×π0,若是,进入步骤(7);若否,则进入步骤(5);(7)批量合并第k层索引包jk中的所有倒排索引,获取第k层副本ik`,进入步骤(8);(8)将第k层索引包jk清空,并将第k层副本ik`移动到所述清空后的第k层索引包jk,进入步骤(9);(9)k=k+1,判断加1后的k是否大于p,若是,则进入步骤(10);若否,则进入步骤(4);其中,p是指索引结构可容纳的索引包数量的最大值;(10)判断是否已创建第k层倒排索引ik,若是,则进入步骤(11);若否,则将第k层倒排索引ik的指针指向第k‑1层副本ik‑1`,并将第k层倒排索引ik的空间大小设为rk×π0;(11)判断第k层倒排索引ik里的微博数量是否达到rk×π0,若是,将第k层副本ik`的指针指向第k层倒排索引ik,将第k层倒排索引ik的指针指向第k‑1层副本ik‑1`,进入步骤(13);若否,进入步骤(12);(12)将第k‑1层副本ik‑1`与第k层倒排索引ik直接合并到第k层倒排索引ik;(13)判断k是否等于m,若是,则将第k层副本ik`存放到硬盘;若否,则k=k+1,并进入步骤(10)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510242074.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种单马达的电动镜面控制器及其驱动电路
- 下一篇:一种踏板组件