[发明专利]企业云存储分块对象重复数据删除和重组版本控制方法有效
申请号: | 201310657167.0 | 申请日: | 2013-12-06 |
公开(公告)号: | CN103714123B | 公开(公告)日: | 2017-06-16 |
发明(设计)人: | 刘军 | 申请(专利权)人: | 温州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市兰锋知识产权代理事务所(普通合伙)44419 | 代理人: | 曹明兰 |
地址: | 325036 浙江省温州市瓯海*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开的企业云存储分块对象重复数据删除方法,将文件输入到分块对象重复数据删除模块;确定用户上传文件的类型;在文件类型表里查找当前文件类型的最优分块大小;若文件的大小小于确定的分块大小,则不进行分块而对文件计算指纹并标记该文件不可再分块后进入查询指纹步骤;若文件能分块则进入下一步骤;对文件的分块和重复数据删除。本发明还公开了企业云存储分块对象重组版本控制方法,用户使用云存储平台时由对象重组文件版本控制模块确定用户请求,根据用户的请求执行重组文件版本。本发明的对象重复数据删除及重组版本控制方法创建文件的对象重组版本索引,解决企业云存储平台中大量用户对同一文档操作导致的文档版本问题。 | ||
搜索关键词: | 企业 存储 分块 对象 重复 数据 删除 重组 版本 控制 方法 | ||
【主权项】:
企业云存储分块对象重复数据删除方法,其特征在于,具体按照以下步骤实施:步骤1、用户有文件要上传到云存储平台时,将文件输入到分块对象重复数据删除模块(1)内;所述分块对象重复数据删除模块(1)用于在文件的上传和更新过程中,云存储用户的文件要存储在对象存储设备(3)中,必须经过分块对象重复数据删除模块,目的在于降低对平台存储设备的资源浪费;步骤2、由分块对象重复数据删除模块(1)内的文件类型库先确定步骤1中用户上传文件的类型;所述文件类型的确定方法为:由分块对象重复数据删除模块(1)内的文件类型库根据文件扩展名和文件头部共同确定文件的实际类型;步骤3、经步骤2确定好文件的类型后,由分块对象重复数据删除模块(1)中的文件类型表里查找当前文件类型的最优分块大小;所述文件类型表集成于所述分块对象重复数据删除模块(1)内,是在数据库中建立的数据表,用于存储计算机可存储的文件类型,根据经验值确定各种类型的常用分块大小并存储,并对相应的文件类型的文件头部建立并存储对象,生成哈希指纹,一行数据确定一个文件类型,由经验值确定当前文件类型的最优分块大小,以及该类型文件头部的对象地址和哈希指纹;步骤4、若整个文件的大小小于步骤3确定的分块大小,即文件无法分成块,则不进行分块操作,直接对整个文件计算哈希指纹,并标记该文件不可再分块后直接进入步骤5.4中用快速指纹查询表查询是否有匹配的哈希指纹;若整个文件的大小大于步骤3确定的分块大小,即文件能够分块,则直接进入步骤5;步骤5、对经步骤4处理后文件的分块和重复数据进行删除,具体按照以下步骤实施:步骤5.1、分块对象重复数据删除模块(1)将文件指针偏移到头部末尾;步骤5.2、对文件进行分块处理,文件分块后的大小为步骤3中确定的分块大小;步骤5.3、计算经步骤5.2得到的文件块的哈希指纹;步骤5.4、根据经步骤5.3计算出文件块的哈希指纹,用快速指纹查询表查询是否有匹配的指纹:若有匹配,则说明有重复数据,对这个文件的有重复数据的分块不创建对象,只创建一个指向已存在指纹的链接;若没有匹配,则说明数据是不重复的,必须给没有重复数据的分块创建一个对象,并将该创建的对象保存到对象存储设备中,再将指纹信息和分块信息分别写入快速指纹查询表和系统文件索引表;步骤5.5、重复步骤5.2直到文件不能再分块为止,当整个文件分块不能再分块,则重复数据删除完成。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学,未经温州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310657167.0/,转载请声明来源钻瓜专利网。
- 上一篇:时钟分发系统和方法
- 下一篇:复合微孔膜及其制作工艺