[发明专利]一种面向大数据环境的元数据组织方法和系统在审
申请号: | 201610056156.0 | 申请日: | 2016-01-27 |
公开(公告)号: | CN105550371A | 公开(公告)日: | 2016-05-04 |
发明(设计)人: | 李春花;周可;杨勇 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 朱仁玲 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 数据 环境 组织 方法 系统 | ||
1.一种面向大数据环境的元数据组织方法,其特征在于,包括以下步 骤:
(1)客户端接收来自用户的元数据请求,并判断该元数据请求的类型, 是文件创建请求,文件查询请求,目录创建请求,目录查询请求,还是文 件和目录重命名请求,如果是文件创建请求,则客户端将该文件创建请求 发送到索引服务器,并进入步骤(2),如果是文件查询请求,则客户端将 该文件查询请求发送到索引服务器,进入步骤(5),如果是目录创建请求, 则转入步骤(9),如果是列表目录元数据请求,则转入步骤(12),如果是 文件和目录重命名请求,则转入步骤(15);
(2)索引服务器根据创建文件请求中待创建文件的绝对路径获取对应 文件的父目录的全局ID和分布编码列表,根据父目录的全局ID和待创建 文件的文件名得到键值对的键,根据该键保存待创建文件的文件索引信息, 并获得用来存储元数据信息的分布编码,其中如果分布编码为新增的或者 父目录分布编码列表中存在超过一个分布编码,则使用布隆过滤器和文件 的全局ID更新分布编码的位图,将分布编码和分布编码对应的后端存储节 点的IP地址和端口号,以及待创建文件的全局ID发送给客户端;
(3)客户端将待创建文件的全局ID、分布编码、以及待创建文件的元 数据信息发送到该IP地址和端口号对应的后端存储节点;
(4)后端存储节点根据待创建文件的全局ID以键值对形式保存待创 建文件的元数据信息,再将此键值对加入到桶号为分布编码的哈希桶中, 并向客户端返回文件元数据创建成功的通知;
(5)索引服务器根据查询文件请求中待查询文件的绝对路径获取对应 文件的全局ID,以及对应文件的父目录的分布编码列表,获取存储文件元 数据时可能使用的分布编码,再根据可能使用的分布编码和后端存储节点 名空间表计算得到对应的后端存储节点IP地址和端口号,并将所有后端存 储节点IP地址和端口号信息列表、以及待查询文件的全局ID发送到客户 端;
(6)客户端根据返回的IP地址和端口号列表依次将待查询文件的全局 ID发送给后端存储节点;
(7)后端存储节点根据待查询文件的全局ID为键查找是否存在元数 据信息,如果存在,则返回元数据信息给客户端,然后转入步骤(8),否 则返回未找到元数据的提示信息给客户端;
(8)客户端判断返回的元数据信息是否是元数据,如果是,则过程结 束,否则根据剩下的IP地址和端口号将待查询文件的全局ID发送给后端 存储节点,并重复执行步骤(7),直至找到元数据为止。
(9)索引服务器根据创建目录请求中待创建目录的绝对路径获取对应 目录的父目录的全局ID和分布编码列表,根据父目录的全局ID和待创建 目录的目录名得到键值对的键,根据该键保存待创建目录的目录索引信息, 并获得用来存储目录元数据信息的分布编码,其中如果分布编码为新增的 或者父目录分布编码列表中存在超过一个分布编码,则使用布隆过滤器和 目录全局ID更新分布编码的位图,将分布编码和分布编码对应的后端存储 节点的IP地址和端口号,以及待创建目录的全局ID发送给客户端;
(10)客户端将待创建目录的全局ID、分布编码、以及待创建目录的 元数据信息发送到该IP地址和端口号对应的后端存储节点;
(11)后端存储节点根据待创建目录的全局ID以键值对形式保存待创 建目录的元数据信息,再将此键值对加入到桶号为分布编码的哈希桶中, 并向客户端返回目录元数据创建成功的通知。
(12)索引服务器根据待列表目录请求中目录的绝对路径获取待列表 目录的分布编码列表,根据分布编码列表和后端存储名空间表计算出所有 分布编码对应的后端存储节点IP地址和端口号,并将分布编码列表及分布 编码对应的后端存储节点IP地址和端口号信息发送到客户端;
(13)客户端根据返回的IP地址和端口号列表依次将对应的分布编码 发送给后端存储节点;
(14)后端存储节点通过分布编码找到对应桶号的哈希桶,并将哈希 桶内的所有元数据信息返回给客户端;
(15)索引服务器根据重命名文件或目录的请求中的待重命名的文件 或目录的绝对路径和新名称得到待重命名文件或目录的全局ID和对应的父 目录的分布编码列表,并用新名称重新保存文件或目录索引节点信息,获 得存储文件或目录的分布编码,将分布编码对应的后端节点IP地址和端口 号,新文件或目录名,以及新文件或目录的全局ID返回给客户端;
(16)客户端根据返回的IP地址和端口号列表依次将待重命名目录的 全局ID和新目录名发送给后端存储节点;
(17)后端存储节点以目录的全局ID为键找到目录的元数据信息,如 果找到,则使用新名称更新目录元数据中的旧名称,并向客户端返回重命 名目录成功的通知,然后转入步骤(18),否则返回未找到元数据的提示信 息给客户端,并转入步骤(18);
(18)客户端判断重命名是否成功,如果成功,则重命名过程结束, 否则根据剩下的IP地址和端口号将待重命名目录的全局ID和新目录名发 送给后端存储节点,并重复执行步骤(17),直至重命名元数据成功为止。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610056156.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置