[发明专利]管理文档索引的方法和设备有效
申请号: | 201810358924.7 | 申请日: | 2018-04-20 |
公开(公告)号: | CN110399545B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 刘敏;张勇;黄一帆;张玉冰;赵科 | 申请(专利权)人: | 伊姆西IP控股有限责任公司 |
主分类号: | G06F16/93 | 分类号: | G06F16/93 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 美国马*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 管理 文档 索引 方法 设备 | ||
本公开的实施例涉及管理文档索引的方法和设备。该方法包括:响应于接收到向包括多个分段的文档集合增加目标分段的请求,从多个分段中确定与目标分段相关联的原始分段;将原始分段分割为第一部分和第二部分,第一部分用于更新原始分段,第二部分用作目标分段;以及针对目标分段内的文档重新建立索引。
技术领域
本公开的实施例总体涉及文档索引,具体涉及管理文档索引的方法和设备。
背景技术
目前,存在多种框架向用户提供搜索并返回匹配的文档的能力。一些分布式搜索引擎将一个索引数据分布在很多节点中,因此在一个索引上的一个查询可以由很多节点同时执行。这些节点获得结果可以被合并并且返回用户。
然而,对于一个索引,用户需要确定索引需要分布在多少个分区(也可以称为碎片、分段等)中,并且该数目在创建之后不能改变。这是因为改变这个数目将导致基本上对与该分区相对应的所有文档重新进行哈希操作。此外,随着系统数据的增加,会导致系统性能的急剧下降。
发明内容
为了解决上述以及其他潜在的问题,本公开的实施例提供了管理文档索引的方法和设备。
根据第一方面,提供了一种管理文档索引的方法。该方法包括:响应于向包括多个分段的文档集合增加目标分段的第一请求,从所述多个分段中确定与所述目标分段相关联的原始分段;将所述原始分段分割为第一部分和第二部分,所述第一部分用于更新所述原始分段,所述第二部分用作所述目标分段;以及针对所述目标分段内的文档重新建立索引。
根据第二方面,提供了一种管理文档索引的设备。该设备包括:处理单元;存储器,耦合至所述处理单元并且包括存储于其上的指令,所述指令在由所述处理单元执行时使所述设备执行动作。所述动作包括:响应于向包括多个分段的文档集合增加目标分段的第一请求,从所述多个分段中确定与所述目标分段相关联的原始分段;将所述原始分段分割为第一部分和第二部分,所述第一部分用于更新所述原始分段,所述第二部分用作所述目标分段;以及针对所述目标分段内的文档重新建立索引。
根据第三方面,提供了一种计算机可读介质,所述计算机可读介质上存储有机器可执行指令,当所述机器可执行指令在被至少一个处理器执行时,使得所述至少一个处理器实现根据第一方面所述的方法。
提供发明内容部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或主要特征,也无意限制本公开的范围。
附图说明
通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。
图1A-图1B示出了根据现有技术的索引管理的示意图;
图2示出了根据本公开的实施例的管理文档索引的架构的框图;
图3A-图3B示出了根据本公开的一些实施例的索引管理的示意图;
图4A-图4B示出了根据本公开的一些实施例的索引管理的示意图;
图5A-图5B示出了根据本公开的一些实施例的索引管理的示意图;
图6示出了根据本公开的实施例的用于管理文档索引的方法的流程图;
图7示出了根据本公开的实施例的用于管理文档索引的方法的流程图;以及
图8示出了可以用来实施本公开的实施例的示例设备的示意性框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伊姆西IP控股有限责任公司,未经伊姆西IP控股有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810358924.7/2.html,转载请声明来源钻瓜专利网。