[发明专利]搜索方法、系统、设备、存储介质和计算机程序产品有效
申请号: | 202111201085.6 | 申请日: | 2021-10-15 |
公开(公告)号: | CN113641780B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 刘洋;李飞飞;沈春辉 | 申请(专利权)人: | 阿里云计算有限公司;阿里巴巴(中国)有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/953 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 刘戈;孙明子 |
地址: | 310012 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 方法 系统 设备 存储 介质 计算机 程序 产品 | ||
1.一种搜索方法,其特征在于,包括:
响应于写入操作,将包含至少一个字段的记录数据写入内存;
响应于所述写入操作,将所述至少一个字段包含的数据划分成至少一个数据片段;
根据所述记录数据中所述至少一个数据片段各自的数据类型,更新内存中所述至少一个数据片段各自对应的第一索引表;
响应于搜索操作,借助支持不同存储结构的预设接口,根据所述第一索引表和磁盘中的第二索引表确定搜索结果,所述第二索引表和所述第一索引表具有不同的存储结构;
其中,所述第一索引表能够在内存中被读取,文本型数据片段对应的第一索引表包括存储结构均为多层数组的倒排索引表和正排索引表;在所述倒排索引表和所述正排索引表中,所述文本型数据片段在前一数组中的元素为所述文本型数据片段在后一数组中元素的下标。
2.根据权利要求1所述的方法,其特征在于,数据片段包括文本型数据;
所述根据所述至少一个数据片段各自的数据类型,更新所述至少一个数据片段所属字段各自对应的所述第一索引表,包括:
根据目标数据片段所属记录数据的标识信息的哈希值和所述目标数据片段的哈希值,更新所述目标数据片段所属字段对应的倒排索引表中的第一数组,所述目标数据片段为所述至少一个数据片段中的任一数据片段;
根据所述第一数组包含的数组元素和所述目标数据片段的编码结果的长度值,更新所述目标数据片段所属字段对应的倒排索引表中的第二数组;
根据所述第二数组包含的数组元素和所述目标数据片段的编码结果,更新所述目标数据片段所属字段对应的倒排索引表中的第三数组;
建立所述第三数组包含的数组元素和所述目标数据片段所属记录数据的标识信息之间的关联关系,以得到所述目标数据片段所属字段对应的倒排索引表中的第四数组。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标数据片段所属记录数据的标识信息的哈希值和所述目标数据片段的哈希值,更新所述目标数据片段所属字段对应的倒排索引表中的第一数组,包括:
根据所述目标数据片段所属记录数据的标识信息的哈希值,确定所述目标数据片段在所述第一数组中对应的第一元素;
根据所述目标数据片段的哈希值,确定所述第一元素在所述第一数组中的下标;
根据所述第一元素以及所述第一元素的下标,更新所述第一数组。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一数组包含的数组元素和所述目标数据片段的编码结果的长度值,更新所述目标数据片段所属字段对应的倒排索引表中的第二数组,包括:
将所述第一元素,确定为所述目标数据片段在所述第二数组中对应的第二元素的下标;
根据所述倒排索引表中第三数组已包含的其他数据片段的编码结果的长度值和所述其他数据片段的数量,确定所述第二元素;
根据所述第二元素以及所述第二元素的下标,更新所述第二数组。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第二数组包含的数组元素和所述目标数据片段的编码结果,更新所述目标数据片段所属字段对应的倒排索引表中的第三数组,包括:
将所述第二元素,确定为所述目标数据片段在所述第三数组中对应的第一类型的第三元素的下标;
按照所述第一类型的第三元素的下标,将所述目标数据片段的编码结果的长度值作为所述第一类型的第三元素,更新所述第三数组;
将所述目标数据片段的编码结果作为第二类型的第三元素,更新所述第三数组。
6.根据权利要求1所述的方法,其特征在于,数据片段包括数值型数据;所述第一索引表包括倒排索引表;
所述根据所述至少一个数据片段各自的数据类型,更新所述至少一个数据片段所属字段各自对应的所述第一索引表,包括:
将目标数据片段所属记录数据的标识信息和所述目标数据片段之间的关联关系更新至所述倒排索引表中的第五数组,所述目标数据片段为所述至少一个数据片段中的任一数据片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里云计算有限公司;阿里巴巴(中国)有限公司,未经阿里云计算有限公司;阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111201085.6/1.html,转载请声明来源钻瓜专利网。