[发明专利]一种基于分布式文件系统的海量地学数据并行处理方法有效
申请号: | 201310076895.2 | 申请日: | 2013-03-11 |
公开(公告)号: | CN103198097A | 公开(公告)日: | 2013-07-10 |
发明(设计)人: | 黎建辉;沈庚;周园春;王学志;韦远科;张洋 | 申请(专利权)人: | 中国科学院计算机网络信息中心 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 余长江 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于分布式文件系统的海量地学数据并行处理方法。本方法为:1)采用分布式文件系统作为地学数据的存储系统,部署在计算集群上;分布式文件系统拥有统一的名称空间;2)计算集群的作业调度系统将接收的计算作业保存到一等待队列中;3)调度系统从等待队列中选择一个计算作业进入运行队列;4)调度系统根据计算作业信息在分布式文件系统的元数据中查找该计算作业运行需要的数据文件所在的计算节点;5)作业调度系统挑选一持有该计算作业运行需要的数据最多的计算节点;该计算节点远程获取该计算作业需要但该计算节点未持有的数据文件,然后在该计算节点执行该计算作业,并返回执行结果。本方法最大程度的做到了计算本地化。 | ||
搜索关键词: | 一种 基于 分布式 文件系统 海量 地学 数据 并行 处理 方法 | ||
【主权项】:
一种基于分布式文件系统的海量地学数据并行处理方法,其步骤为:1)采用分布式文件系统作为地学数据的存储系统,将所述分布式文件系统部署在计算集群上;其中,所述分布式文件系统拥有一个统一的名称空间;2)计算集群的作业调度系统将接收的计算作业保存到一等待队列中;3)作业调度系统从所述等待队列中选择一个计算作业进入运行队列;4)作业调度系统根据进入所述运行队列的计算作业信息,在分布式文件系统的元数据中查找该计算作业运行需要的数据文件所在的计算节点;5)作业调度系统从4)所得计算节点中挑选一持有该计算作业运行需要的数据最多的计算节点;该计算节点远程获取该计算作业需要但该计算节点未持有的数据文件,然后在该计算节点执行该计算作业,并将执行结果返回给作业调度系统;6)作业调度系统从所述运行队列中删除该计算作业。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算机网络信息中心,未经中国科学院计算机网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310076895.2/,转载请声明来源钻瓜专利网。