[发明专利]一种关键字的检索方法及装置、电子设备、存储介质在审
申请号: | 202111401172.6 | 申请日: | 2021-11-19 |
公开(公告)号: | CN114090512A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 李长春;牛鹏举;张涛;李鹏辉;李志鹏;王智毅;张宇峰;李忠 | 申请(专利权)人: | 中国电信集团系统集成有限责任公司 |
主分类号: | G06F16/14 | 分类号: | G06F16/14;G06F16/182 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 蒋姗 |
地址: | 100082 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 关键字 检索 方法 装置 电子设备 存储 介质 | ||
本申请提供一种关键字的检索方法及装置、电子设备、存储介质。关键字的检索方法,包括:获取检索请求;所述检索请求中包括:检索关键字和所述检索关键字对应的分布式文件的信息;根据所述分布式文件的信息确定所述分布式文件对应的多个数据分片的名称;基于各个数据分片的名称依次读取各个数据分片的数据,并判断当前读取的数据中是否包括所述检索关键字;若当前读取的数据中包括所述检索关键字,根据所述检索关键字在所述当前读取的数据中的位置输出所述检索关键字的检索结果。该检索方法用以降低关键字检索带来的集群消耗,提高关键字检索的效率。
技术领域
本申请涉及分布式存储技术领域,具体而言,涉及一种关键字的检索方法及装置、电子设备、存储介质。
背景技术
现有的分布式文件系统,兼容posix(可移植操作系统接口(英语:PortableOperating System Interface,缩写为POSIX))标准,提供用户检索文件中关键字的功能,使用户能够基于关键字搜索文件中是否存在自身感兴趣的信息。
现有技术中,当用户检索文件关键字时,分布式文件系统需要确定文件所散落的数据分片,之后把文件所属的数据分片聚合成完整文件,之后开始做过滤关键字操作。
这种检索方式的问题为:用户检索延时大,影响用户体验;客户端集群网卡宽带波动大,宽带有限,对集群负载也有波动影响。
发明内容
本申请实施例的目的在于提供一种关键字的检索方法及装置、电子设备、存储介质,用以降低关键字检索带来的集群消耗,提高关键字检索的效率。
第一方面,本申请实施例提供一种关键字的检索方法,包括:获取检索请求;所述检索请求中包括:检索关键字和所述检索关键字对应的分布式文件的信息;根据所述分布式文件的信息确定所述分布式文件对应的多个数据分片的名称;基于各个数据分片的名称依次读取各个数据分片的数据,并判断当前读取的数据中是否包括所述检索关键字;若当前读取的数据中包括所述检索关键字,根据所述检索关键字在所述当前读取的数据中的位置输出所述检索关键字的检索结果。
在本申请实施例中,与现有技术相比,根据分布式文件的信息确定分布式文件对应的多个数据分片的名称,然后基于多个数据分片的名称依次读取各个数据分片的数据,并进行检索关键字的检索;在整个检索过程中,不需要将数据分片聚合成完整文件,减少因读取所有文件分片并聚合所造成的集群消耗,降低关键字检索带来的集群消耗;减少大文件检索关键字的时间,提高关键字检索的效率。
作为一种可能的实现方式,所述分布式文件的信息包括:所述分布式文件的名称;所述根据所述分布式文件的信息确定所述分布式文件对应的多个数据分片的名称,包括:根据所述分布式文件的名称获取所述分布式文件的属性信息;获取所述多个数据分片分别对应的切片号;根据所述属性信息和所述多个数据分片分别对应的切片号确定所述分布式文件对应的多个数据分片的名称。
在本申请实施例中,通过分布式文件的名称,获取分布式文件的属性信息;并获取多个数据分别对应的切片号;进而,根据属性信息和各个切片号实现分布式文件对应的多个数据分片的名称的有效且准确的确定。
作为一种可能的实现方式,所述获取所述多个数据分片分别对应的切片号,包括:获取所述分布式文件的分片规则;根据所述分片规则确定所述多个数据分片分别对应的切片号。
在本申请实施例中,通过获取分布式文件的分片规则,然后根据分片规则实现多个数据分片分别对应的切片号的有效确定。
作为一种可能的实现方式,所述基于各个数据分片的名称依次读取各个数据分片的数据,包括:将所述各个数据分片的名称组成分片名称集合;每次从所述分片名称集合中取出一个分片名称,读取该分片名称对应的数据分片的数据。
在本申请实施例中,通过将各个数据分片的名称组成分片名称集合,可以按照该分片集合,依次读取各个分片名称对应的数据分片的数据,提供关键字检索的效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信集团系统集成有限责任公司,未经中国电信集团系统集成有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111401172.6/2.html,转载请声明来源钻瓜专利网。