[发明专利]高维Torus网络的自适应容错路由方法及装置有效
申请号: | 201910412588.4 | 申请日: | 2019-05-17 |
公开(公告)号: | CN111953589B | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 向东;潘群杨 | 申请(专利权)人: | 清华大学 |
主分类号: | H04L12/703 | 分类号: | H04L12/703;H04L12/721 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王庆龙;李相雨 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | torus 网络 自适应 容错 路由 方法 装置 | ||
本发明实施例提供一种高维Torus网络的自适应容错路由方法及装置,其中方法包括:在每一维度torus网络中,使用流控方法判断是否存在合适的通道和缓存组成自适应路由,若存在,则将所述通道作为该维度torus网络中的可选路由通道;根据通道选择方法从各维度torus网络的可选路由通道中选择最佳路由通道进行路由。本发明实施例只使用了一条虚拟通道和两个不区分的缓存,从而避免了资源使用不均衡的问题,提高了系统性能。在容错的实现上,通过储存有限数量的安全信息就可以实现容错路由。
技术领域
本发明涉及计算机网络技术领域,更具体地,涉及高维Torus网络的自适应容错路由方法及装置。
背景技术
近年由于各领域对计算能力的需求日益增长,高性能的计算机得到了广泛的研究和发展。在高性能互连中,torus网络被广泛的使用。特别是在高维网络的应用中,如IBM的商业超级计算机Blue/Gene Q就使用了5维的torus网络,日本的K-computer也使用了6维的torus网络。但随着网络规模的不断增大,可靠性问题日益严峻。而故障的发生很容易导致计算机在运行过程中出现死机。同时也会让已有的无死锁路由方案变得无效。所以不管是从理论研究还是实际应用上考虑,设计具有容错性能的高性能互连网络变得十分必要,又极具挑战。
Duato的协议在mesh/torus中提供了完全自适应的无死锁路由。通过增加一些额外的自适应通道,将无死锁基本路由方法扩展到完全自适应无死锁路由方案。当前在Torus网络中,可以实现容错路由的方案还不是很多,Puente等提出了一种torus网络的容错路由方法,此方法会根据故障点形成一颗连通路由树从而达到对现有硬件的重新配置。该方法需要使用3条虚拟通道。其中一条是用来做完全自适应路由的通道A0,另外两条通道用来做避免死锁的逃脱通道,E1和E2。方法要求消息在自适应路由网络A0中出现死锁时进入E1逃脱网络。在E1网络中如果遇到故障时进入E2逃脱网络。进入E2网络后就不能再使用E1网络。其中方法的A0,E1通道和Bubble Flow Control方法的通道设置一样。另外文献还实现了容错路由的动态重构。但此方法由于占用大量的资源并不适合在高维多节点的大网络中使用。
发明内容
本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的高维Torus网络的自适应容错路由方法及装置及装置。
第一个方面,本发明实施例提供一种高维Torus网络的自适应容错路由方法,包括:
在每一维度torus网络中,使用流控方法判断是否存在合适的通道和缓存组成自适应路由,若存在,则将所述通道作为该维度torus网络中的可选路由通道;
根据通道选择方法从各维度torus网络的可选路由通道中选择最佳路由通道进行路由。
第二个方面,本发明实施例提供一种高维Torus网络的自适应容错路由装置,包括:
可选路由通道获取模块,用于在每一维度torus网络中,使用流控方法判断是否存在合适的通道和缓存组成自适应路由,若存在,则将所述通道作为该维度torus网络中的可选路由通道;
最佳路由选择模块,根据通道选择方法从各维度torus网络的可选路由通道中选择最佳路由通道进行路由。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910412588.4/2.html,转载请声明来源钻瓜专利网。