[发明专利]编码方法、装置、计算设备及计算机存储介质在审
申请号: | 202211255501.5 | 申请日: | 2022-10-13 |
公开(公告)号: | CN115642987A | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 梁松涛;郭明;朱洪亮 | 申请(专利权)人: | 上海哔哩哔哩科技有限公司 |
主分类号: | H04L1/00 | 分类号: | H04L1/00 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙) 11276 | 代理人: | 宋菲 |
地址: | 200433 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 编码 方法 装置 计算 设备 计算机 存储 介质 | ||
本申请公开了一种编码方法、装置、计算设备及计算机存储介质,涉及数据处理技术领域,该方法基于预先构造的第一纠删码和多个第二纠删码而实现,包括:根据待编码数据生成多个数据分片,将多个数据分片划分为多个数据分片组;利用第一纠删码,对多个数据分片进行全局编码,生成全局校验分片;利用多个第二纠删码分别对多个数据分片组中的至少一部分数据分片组进行局部编码,生成一部分局部校验分片;根据一部分局部校验分片,生成另一部分局部校验分片。通过上述方式,本申请能够实现快速编码,还有助于提升解码的概率。
技术领域
本申请涉及数据处理技术领域,具体涉及一种编码方法、装置、计算设备及计算机存储介质。
背景技术
纠删码是一种数据保护方法,它将数据分割成片段,把冗余数据块扩展、编码,并将其存储在不同的位置,比如磁盘、存储节点或者其它地理位置。
LRC纠删码是一种分布式存储系统中综合考虑解码带宽、冗余和纠错能力的一种编码,LRC编解码方式在分布式存储系统中已经得到了一定的应用,基于系统设计的不同,LRC编解码的参数各不相同。
但是,发明人在实现本申请的过程发现:现有的LRC编解码方式中,编码和解码的性能较差,分片发生故障之后修复概率不能最大化。
发明内容
本申请实施例的目的是提供一种编码方法、装置、计算设备及计算机存储介质以及一种解码方法、装置、计算设备及计算机存储介质,以解决上述现有技术存在的编码和解码的性能较差、分片发生故障之后修复概率不能最大化的问题。
根据本申请的一个方面,提供了一种编码方法,方法基于预先构造的第一纠删码和多个第二纠删码而实现,包括:
根据待编码数据生成多个数据分片,将多个数据分片划分为多个数据分片组;
利用第一纠删码,对多个数据分片进行全局编码,生成全局校验分片;
利用多个第二纠删码分别对多个数据分片组中的至少一部分数据分片组进行局部编码,生成一部分局部校验分片;根据一部分局部校验分片,生成另一部分局部校验分片。
可选地,方法进一步包括:将多个数据分片、局部校验分片和全局校验分片分别存储到不同的存储节点中。
可选地,根据待编码数据生成多个数据分片进一步包括:将待编码数据拆分为m个待编码子数据,将m个待编码子数据分别写入到m个数据分片中。
可选地,利用第一纠删码,对多个数据分片进行全局编码,生成全局校验分片进一步包括:
利用第一纠删码,对m个数据分片进行全局编码,得到g个全局校验数据,将g-1个全局校验数据分别写入到g-1个全局校验分片中;
方法还包括:将除了g-1个全局校验数据以外的1个全局校验数据作为中间数据写入到第l个局部校验分片中,其中,l为数据分片组的数量。
可选地,利用多个第二纠删码分别对多个数据分片组中的至少一部分数据分片组进行局部编码,生成一部分局部校验分片进一步包括:
针对第i个数据分片组,0<i<l,利用第i个第二纠删码对第i个数据分片组进行局部编码,得到第i个局部校验数据,将第i个局部校验数据写入到第i个局部校验分片中。
可选地,根据一部分局部校验分片,生成另一部分局部校验分片进一步包括:针对第l个数据分片组,根据第1至第l个局部校验分片写入的数据,得到第l个局部校验数据,将第l个局部校验数据写入第l个局部校验分片中。
根据本申请的另一方面,提供了一种解码方法,方法基于预先构造的第一纠删码和多个第二纠删码而实现,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海哔哩哔哩科技有限公司,未经上海哔哩哔哩科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211255501.5/2.html,转载请声明来源钻瓜专利网。