[发明专利]索引结构操作方法、装置和系统在审
申请号: | 201810924287.5 | 申请日: | 2018-08-14 |
公开(公告)号: | CN109408613A | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | 吕文先 | 申请(专利权)人: | 广东神马搜索科技有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 张阳 |
地址: | 510627 广东省广州市天河区黄埔大*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 索引结构 读取 写入 索引 内存 远程动态更新 缓存 动态内存 索引操作 索引更新 读写 延时 复制 更新 | ||
1.一种索引结构操作方法,包括:
将持续获取的索引结构的更新写入内存;以及
复制写入的索引结构,以确保针对所述索引结构的读取和写入针对两份当前有效的索引结构各自同时进行。
2.如权利要求1所述的方法,其中,所述索引结构包括倒排表和正排表,所述倒排表由包括关键词ID和指向文档指针向量的倒排指针的倒排项构成,所述正排表由包括文档ID和指向文档内容的正排指针的正排项构成。
3.如权利要求2所述的方法,其中,所述倒排指针和所述正排指针是智能指针。
4.如权利要求2所述的方法,其中,将持续获取的索引结构的更新写入内存包括:
将所述两份当前有效的索引结构中的一份当前有效的索引结构分成多个并行写入区域;以及
针对多个并行写入区域,执行并行的索引结构更新写入操作。
5.如权利要求4所述的方法,还包括:
针对所述两份当前有效的索引结构中的另一份当前有效的索引结构进行高并发的读取操作。
6.如权利要求6所述的方法,其中,针对所述两份当前有效的索引结构中的另一份当前有效的索引结构进行高并发的读取操作包括如下至少一项:
基于输入的关键词ID,返回所述倒排表中与所述关键词ID相对应的倒排项中的指向文档指针向量的倒排指针;
基于输入的文档ID,返回所述正排表中与所述文档ID相对应的正排项中指向文档内容的正排指针;以及
基于输入的文档ID集合,返回指向包括多个对应正排指针的文档向量的指针。
7.如权利要求1所述的方法,还包括:
获取倒排表和正排表以构造初始索引结构。
8.如权利要求2所述的方法,其中,将持续获取的索引结构的更新写入内存包括:
收集预定时间段内被读取的倒排项和正排项;
获取针对所述倒排项和正排项的更新以写入内存。
9.如权利要求8所述的方法,其中,获取针对所述倒排项和正排项的更新以写入内存包括:
在所述倒排项和正排项到达写入可用时间的情况下获取针对所述倒排项和正排项的更新以写入内存。
10.如权利要求1所述的方法,还包括:
删除所述索引结构中超过预定删除时间的项目。
11.如权利要求1所述的方法,其中,所述两份当前有效的索引结构共用文档属性内容。
12.一种索引结构操作系统,包括:
索引服务器,所述索引服务器维护、持续更新并下发用于进行检索的索引结构;以及
多个业务服务器,每个所述业务服务器用于:
将持续获取的索引结构的更新写入内存;以及
复制写入的索引结构,以确保针对所述索引结构的读取和写入针
对两份当前有效的索引结构各自同时进行。
13.如权利要求12所述的系统,其中,所述索引结构包括倒排表和正排表,所述倒排表由包括关键词ID和指向文档指针向量的倒排指针的倒排项构成,所述正排表由包括文档ID和指向文档内容的正排指针的正排项构成。
14.如权利要求13所述的系统,其中,所述业务服务器用于将持续获取的索引结构的更新写入内存包括:
将所述两份当前有效的索引结构中的一份当前有效的索引结构分成多个并行写入区域;以及
针对多个并行写入区域,执行并行的索引结构更新写入操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东神马搜索科技有限公司,未经广东神马搜索科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810924287.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于动态图例的地图交互方法
- 下一篇:一种句法依存树动态可视化方法及系统