[发明专利]匹配于高性能计算机结构的多层嵌套负载平衡方法有效
申请号: | 201410676230.X | 申请日: | 2014-11-21 |
公开(公告)号: | CN104331336A | 公开(公告)日: | 2015-02-04 |
发明(设计)人: | 刘旭;曹小林;莫则尧 | 申请(专利权)人: | 北京应用物理与计算数学研究所 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 王天尧 |
地址: | 100088*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 匹配 性能 计算机 结构 多层 嵌套 负载 平衡 方法 | ||
1.一种匹配于高性能计算机结构的多层嵌套负载平衡方法,其特征在于,包括:
在计算机中,将计算区域划分为N个二级计算子区域,并将所述N个二级计算子区域一一对应地映射到计算机内部的N个计算节点上,其中,N为正整数;
在每个计算节点中,将与该计算节点对应的二级计算子区域划分为M个三级计算子区域,并将所述M个三级计算子区域一一对应地映射到该计算节点的M个CPU上,其中,M为正整数。
2.如权利要求1所述的方法,其特征在于,在将所述M个三级计算子区域一一对应地映射到该计算节点的M个CPU上之后,所述方法还包括:
在每个CPU中,将与该CPU对应的三级计算子区域划分为Q个四级计算子区域,并将所述Q个四级计算子区域一一对应地映射到该CPU的Q个CPU内核上,其中,Q为正整数。
3.如权利要求2所述的方法,其特征在于:
所述N个计算节点,并行地将二级计算子区域划分为多个三级计算子区域,并行地将三级计算子区域一一对应地映射到CPU上;
和/或,M*N个CPU,并行地将三级计算子区域划分为多个四级计算子区域,并行地将四级计算子区域一一对应地映射到CPU内核上。
4.如权利要求1所述的方法,其特征在于,在计算机中,将计算区域划分为N个二级计算子区域,包括:
在计算机中,按照先保证减少数据移动,然后保证负载平衡的原则,将计算区域划分为N个二级计算子区域。
5.如权利要求1所述的方法,其特征在于,在每个计算节点中,将与该计算节点对应的二级计算子区域划分为M个三级计算子区域,包括:
在每个计算节点中,按照先保证负载平衡,然后保证减少数据移动的原则,将与该计算节点对应的二级计算子区域划分为M个三级计算子区域。
6.如权利要求2所述的方法,其特征在于,在每个CPU中,将与该CPU对应的三级计算子区域划分为Q个四级计算子区域,包括:
在每个CPU中,按照先保证负载平衡,然后减少表面积的原则,将与该CPU对应的三级计算子区域划分为Q个四级计算子区域。
7.如权利要求2所述的方法,其特征在于:
将计算区域划分为N个二级计算子区域,包括:采用坐标递归对分法,将计算区域划分为N个二级计算子区域;
和/或,
将与该计算节点对应的二级计算子区域划分为M个三级计算子区域,包括:采用坐标递归对分法,将与该计算节点对应的二级计算子区域划分为M个三级计算子区域;
和/或,
将与该CPU对应的三级计算子区域划分为Q个四级计算子区域,包括:
采用坐标递归对分法,将与该CPU对应的三级计算子区域划分为Q个四级计算子区域。
8.如权利要求7所述的方法,其特征在于,所述坐标递归对分法包括:
将计算区域中的网格单元投影到坐标轴上,形成一维序列;
将所述一维序列均分成二部分,得到对应的网格单元的分解;
递归执行上述步骤,将计算区域分为多个子区域。
9.如权利要求1所述的方法,其特征在于:
每个计算节点对应的二级计算子区域使用一个patch domain数据结构的实例进行存储,patch domain数据结构的实例与计算节点一一对应;
和或,每个CPU对应的三级计算子区域使用一个patch region数据结构的实例进行存储,patch region数据结构的实例与CPU一一对应。
10.如权利要求2所述的方法,其特征在于,每个CPU核对应的四级计算子区域使用一个patch数据结构的实例进行存储,patch数据结构的实例与CPU核一一对应。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京应用物理与计算数学研究所,未经北京应用物理与计算数学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410676230.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:采集系统专用工具箱
- 下一篇:一种车床卡盘装卸装置