[发明专利]超级并行计算机的插框级紧耦合监控管理系统无效
申请号: | 201310071179.5 | 申请日: | 2013-03-06 |
公开(公告)号: | CN103136086A | 公开(公告)日: | 2013-06-05 |
发明(设计)人: | 蒋句平;李宝峰;徐炜遐;田宝华;郑明玲;张晓明;李小芳;邢建英;袁远;孙言强;陈旭;罗煜峰;胡积平 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F11/30 | 分类号: | G06F11/30 |
代理公司: | 湖南兆弘专利事务所 43008 | 代理人: | 赵洪;周长清 |
地址: | 410073 湖南省长沙市砚瓦池正*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 超级 并行 计算机 插框级紧 耦合 监控 管理 系统 | ||
技术领域
本发明主要涉及到高性能计算、超级并行计算机系统监控和管理技术领域,特指一种超级并行计算机的插框级紧耦合监控管理系统。
背景技术
随着应用水平的持续提高和应用领域的不断拓展,当前超级并行计算机的计算能力已经跨越千万亿次,正在从万万亿次向十万万亿次甚至百万万亿次推进。系统规模的快速扩张带动了系统组件,尤其是计算结点数量的大幅增长。2012年11月公布的第40期世界超级并行计算机系统TOP500排名榜上,位列第一位的Cray Titan系统的计算结点数量达到了18688个,而第二位的IBM Sequoia的计算结点数量更是达到了惊人的98304个。
海量系统组件给超级并行计算机系统的监控管理带来极大困难,超级并行计算机系统常使用插框级的监控管理系统。当前,插框级的监控管理系统主要有两种:
第一种,总线式监控管理系统。如图1所示,插框内包含计算组件、监控管理组件、背板等。计算组件上设置监控代理;监控代理通过I2C/SMBus、JTAG、UART、GPIO等监控管理接口连接计算组件上的监控管理部件,提供系统管理总线接口通过背板接入插框监控管理系统,负责接受、解析、执行监控管理组件的监控管理命令,执行完毕返回执行结果,同时负责将计算组件的当前异常情况主动上报给监控管理组件。监控管理组件通过系统管理总线接口接入插框监控管理系统,实现对所有计算组件的监控管理。常见的系统管理总线有IPMB及其他定制总线,常见的监控代理芯片有BMC、IPMC等。
第二种,松散式监控管理系统。如图2所示,与总线式监控管理系统类似,计算组件上设置监控代理;监控代理连接计算组件上的监控管理部件的方式和接口均相同,但对外提供网络接口通过线缆或背板等方式接入系统管理网络。监控管理服务器负责对所有计算组件进行监控管理,通过网络接口接入系统管理网络。若通过背板连接,则一般情况下需要插框内提供网络交换机组件,所有监控代理连接至该交换机,并通过交换机上连到系统管理网络。监控管理服务器可选择放置或不放置在插框内。
但上述两种插框级监控管理系统都存在缺点。总线式监控管理系统受限于总线架构,不可避免地存在总线竞争问题,从而导致监控管理的实时性和可靠性较低。松散式监控管理系统则一方面因为需要大量的线缆和交换机而成本较高,另一方面监控管理服务器一般面向全系统而非某个插框进行管理,管理任务繁重,不仅实时性较低,而且易造成由于监控管理服务器故障而引发系统故障的严重后果。
发明内容
本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种结构简单、成本低廉、实时性好、可靠性高的超级并行计算机的插框级紧耦合监控管理系统。
为解决上述技术问题,本发明采用以下技术方案:
一种超级并行计算机的插框级紧耦合监控管理系统,包含背板以及若干个计算组件、监控管理组件,所有计算组件和监控管理组件均连接至背板并通过背板实现接口到接口的紧耦合直连结构;所述监控管理组件用来对所有计算组件进行实时监控管理,并通过网络接口接入系统管理网络。
作为本发明的进一步改进:
所述计算组件上设置有:
若干种类型的监控管理部件,用来对计算组件的运行状态进行实时监控;
一条以上边界扫描测试链路,用来对计算组件进行调试诊断功能;
UART控制器,用来实现计算组件软件系统的交互功能;
若干GPIOs引腿,用来实现对计算组件的控制、异常检测和上报功能。
所述监控管理部件通过I2C/SMBus总线与计算组件的温度监控、电源监控、风机监控部件相连。
所述边界扫描测试链路采用JTAG边界扫描链,所有JTAG边界扫描链均通过JTAG链切换设备连接至JTAG接口。
所述I2C/SMBus总线、JTAG接口、UART、GPIOs均通过背板最终连接到监控管理组件的相应接口上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310071179.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种改进的铸钢包供气管接头装置
- 下一篇:顶进施工法用带止水条的钢筋混凝土管