[发明专利]用于数据索引的方法、电子设备和计算机程序产品在审

专利信息
申请号: 202010479672.0 申请日: 2020-05-29
公开(公告)号: CN113742288A 公开(公告)日: 2021-12-03
发明(设计)人: 陈强;于靖;吴鹏飞 申请(专利权)人: 伊姆西IP控股有限责任公司
主分类号: G06F16/13 分类号: G06F16/13;G06F16/14;G06F16/16;G06F16/18
代理公司: 北京市金杜律师事务所 11256 代理人: 罗利娜
地址: 美国马*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 数据 索引 方法 电子设备 计算机 程序 产品
【说明书】:

本公开的实施例提供了一种用于数据索引的方法、电子设备和计算机程序产品。用于数据索引的方法包括获得用于存储的多个数据块。该方法还包括生成多个数据块的多个向量化表示,使多个数据块中相似性更高的数据块的向量化表示之间的差异更小。该方法还包括存储多个向量化表示以用于分别索引多个数据块。通过向量化表示作为数据块的索引,可以借助向量化表示来有效衡量数据块的相似性,从而提供了基于相似性执行数据块的模糊搜索的可能性。

技术领域

本公开的实施例总体上涉及存储系统,并且更特别地,涉及一种用于数据索引的方法、电子设备和计算机程序产品。

背景技术

在存储系统中,诸如在文件系统、备份系统等系统中,文件和数据被划分为具有固定长度或可变长度的数据块进行存储。为了支持快速随机访问和重复数据删除,通常会构建数据块对应的索引,通过索引来从所存储的大量数据块中查找和定位期望的数据块。索引的构建将影响到数据查询和访问的效率和对不同应用场景的适用性。

发明内容

本公开的实施例涉及一种用于数据索引的改进方案。

在本公开的第一方面,提供了一种用于数据索引的方法。该方法包括获得用于存储的多个数据块。该方法还包括生成多个数据块的多个向量化表示,使多个数据块中相似性更高的数据块的向量化表示之间的差异更小。该方法还包括存储多个向量化表示以用于分别索引多个数据块。

在本公开的第二方面,提供了一种电子设备。该电子设备包括至少一个处理器;以及存储有计算机程序指令的至少一个存储器,至少一个存储器和计算机程序指令被配置为与至少一个处理器一起使电子设备执行动作。动作包括:获得用于存储的多个数据块;生成多个数据块的多个向量化表示,使多个数据块中相似性更高的数据块的向量化表示之间的差异更小;以及存储多个向量化表示以用于分别索引多个数据块。

在本公开的第三方面,提供了一种计算机程序产品。该计算机程序产品被有形地存储在非易失性计算机可读介质上并且包括计算机可执行指令。计算机可执行指令在被执行时使设备执行动作。动作包括:获得用于存储的多个数据块;生成多个数据块的多个向量化表示,使多个数据块中相似性更高的数据块的向量化表示之间的差异更小;以及存储多个向量化表示以用于分别索引多个数据块。

应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其他特征通过以下的描述将变得容易理解。

附图说明

通过参考附图阅读下文的详细描述,本公开的实施例的上述以及其他目的、特征和优点将变得容易理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施例,其中:

图1示出了本公开的实施例可以在其中被实现的示例环境的框图;

图2示出了在图1的环境中的数据查询的示例;

图3示出了根据本公开的一些实施例的数据管理系统的框图;

图4示出了根据本公开的一些实施例的用于训练表示生成模型的系统的框图;

图5示出了根据本公开的另一些实施例的数据管理系统的框图;

图6示出了根据本公开的一些实施例的用于存储索引的数据结构的示意图;

图7示出了根据本公开的一些实施例的用于数据索引的过程的流程图;以及

图8示出了可以被用来实施本公开的实施例的设备的示意性框图。

贯穿所有附图,相同或者相似的参考标号被用来表示相同或者相似的组件。

具体实施方式

下面将参考附图中所示出的若干示例性实施例来描述本公开的原理和精神。应当理解,描述这些具体的实施例仅是为了使本领域的技术人员能够更好地理解并实现本公开,而并非以任何方式限制本公开的范围。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伊姆西IP控股有限责任公司,未经伊姆西IP控股有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010479672.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top