[发明专利]数据清除方法、装置及系统在审
申请号: | 201210327249.4 | 申请日: | 2012-09-06 |
公开(公告)号: | CN103678337A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 陈宝罗 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘芳 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 清除 方法 装置 系统 | ||
技术领域
本发明涉及计算机技术,尤其涉及一种数据清除方法、装置及系统。
背景技术
分布式文件系统具有执行远程文件存取的能力,并以透明方式对分布在网络上的文件进行管理和存取。在分布式文件系统中,文件的存储方式与本地文件系统相比存在较大差别。首先,在本地文件系统中,文件直接存储在本地节点的物理存储资源上;而在分布式文件系统中,文件的元数据和各数据分片分离,元数据和各数据分片可能存储在不同的网络节点上,相应地,对各数据分片进行读写及删除等操作是需要经过网络远程完成的。其次,在本地文件系统中,可以在本地直接对文件进行写或者修改等操作;而在分布式文件系统中,为了保证对文件进行修改写之后文件内容的正确性,需要将对各数据分片进行的修改写操作转换为写操作,使得各数据分片在被修改后存储为新的数据分片。
基于上述分布式文件系统的特点,在需要对分布在不同网络节点上的各数据分片进行删除时,需要严格控制删除顺序。由应用程序所在的应用服务器向元数据所在的元数据服务器发送删除文件的指令;元数据服务器读取该待删除文件的元数据信息,并根据元数据信息向各数据分片所在的数据服务器发送删除指令,删除该文件的各数据分片;元数据服务器在控制各数据服务器完成删除操作之后,再将该文件的元数据删除,从而完成对文件的删除。
但是,若该分布式文件系统在删除操作过程中出现网络或节点故障等问题时,元数据服务器虽然向数据服务器发送了删除文件的指令,但数据服务器由于网络故障等原因没有接收到该指令,而元数据服务器在发送删除文件的指令后将存储的元数据信息进行了删除,这就会导致部分数据分片未被成功删除,使得未被删除的数据分片成为无效文件或者垃圾文件,该部分无效文件所占用的空间无法得到释放,将会对系统资源造成浪费。
发明内容
本发明提供了一种数据清除方法、装置及系统,用于解决在分布式文件系统发生故障时,未被删除的数据分片成为文件,对系统资源造成浪费的问题。
本发明的第一方面是提供一种数据清除方法,包括:
向元数据服务器发送查询请求,所述查询请求中携带有数据对象对应的文件标识,所述文件标识为在接收到应用服务器发送的写操作指令后,对文件进行写操作时,写入所述文件对应的数据对象中的;
接收所述元数据服务器返回的查询结果;
若所述查询结果表明所述数据对象对应的文件标识不存在于所述元数据服务器中,则将所述不存在于所述元数据服务器中的文件标识对应的数据对象清除。
本发明的第一方面的第一种实施方式,提供一种数据清除方法,在所述向元数据服务器发送查询请求之前,所述方法还包括:
周期性地对存储的所述数据对象进行扫描,以获得所述数据对象的属性信息;
读取所述数据对象的属性信息,所述属性信息中包括所述数据对象对应的文件标识。
结合本发明的第一方面的第一种实施方式,本发明的第一方面的第二种实施方式,提供一种数据清除方法,所述属性信息中还包括所述数据对象对应的时间戳;
所述接收所述元数据服务器返回的查询结果之后,所述方法还包括:
若所述查询结果表明所述数据对象对应的文件标识存在于所述元数据服务器中,则判断所述存在于所述元数据服务器中的文件标识是否为两个或多个数据对象对应的同一个文件标识;
若是,则对所述两个或多个数据对象的时间戳进行比较,获得所述两个或多个数据对象中时间戳的最大值;
将所述两个或多个数据对象中时间戳小于所述最大值的数据对象清除。
本发明的第二方面是提供一种数据清除方法,包括:
接收数据服务器发送的查询请求,所述查询请求中携带有一个或多个数据对象分别对应的文件标识,所述文件标识为所述数据服务器在接收到应用服务器发送的写操作指令后,对文件进行写操作时,写入所述文件对应的数据对象中的;
根据所述查询请求,判断是否存在与各所述文件标识分别对应的文件的元数据,若是,则查询结果表明文件标识存在于元数据服务器中,若否,则所述查询结果表明文件标识不存在于所述元数据服务器中;
向所述数据服务器返回查询结果,以供所述数据服务器根据所述查询结果,将不存在于所述元数据服务器中的文件标识所对应的数据对象清除。
本发明第三方面是提供一种数据服务器,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210327249.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文本挖掘方法和文本挖掘装置
- 下一篇:实体词识别方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置