[发明专利]一种基于异构集群的作业调度系统及方法在审
申请号: | 201410405297.X | 申请日: | 2014-08-18 |
公开(公告)号: | CN104125165A | 公开(公告)日: | 2014-10-29 |
发明(设计)人: | 陈良华 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | H04L12/861 | 分类号: | H04L12/861 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250101 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 集群 作业 调度 系统 方法 | ||
1.一种基于异构集群的作业调度系统,其特征在于:包括2台作业调度服务器、n台CPU计算节点服务器、n台GPU计算节点服务器和共享存储设备;采用以太网做集群管理网络,使用infiniband高速网络做计算网络,操作系统采用Redhat linux。
2.根据权利要求1所述的基于异构集群的作业调度系统,其特征在于:所述作业调度服务器采用开源PBS作业调度软件(openpbs、torque等)。
3.根据权利要求2所述的基于异构集群的作业调度系统,其特征在于:所述开源PBS作业调度软件采用openpbs或者torque。
4.根据权利要求1所述的基于异构集群的作业调度方法,其特征在于包括以下步骤:
第一步:建立CPU和GPU计算队列,对应后端计算节点服务器进行计算资源的分配;
第二步:结合用户需求,分别建立计算用户,用户计算目录对应到后端共享存储;
第三步:在用户需要进行CPU计算资源时,对CPU资源进行划分,单节点CPU依据核心数量进行资源分配,保证CPU计算节点利用率达到100%;
第四步:在GPU节点上安装CUDA和OpenMPI环境,指定标准环境变量;
第五步:建立异构作业标准PBS模板,可以手动指定CPU和GPU计算资源需求数量;
第六步:异构作业需求用户可以自己编写CUDA程序,编译完成后,使用参考PBS脚本选择计算资源,并将作业提交到GPU队列计算资源池;
第七步:GPU作业同时使用CPU和GPU计算资源进行计算,运行完成后,计算结果输出的共享存储目录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410405297.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种共享资源的调度方法和系统
- 下一篇:用于潜油电机转子工艺轴的退轴装置