[发明专利]一种基于飞腾平台的高性能计算资源监控实现方法在审
申请号: | 202210699362.9 | 申请日: | 2022-06-20 |
公开(公告)号: | CN115129541A | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 赵梓欣;赵博颖;冯岳;张琨;孟飞 | 申请(专利权)人: | 北京计算机技术及应用研究所 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;H04L67/025 |
代理公司: | 中国兵器工业集团公司专利中心 11011 | 代理人: | 辛海明 |
地址: | 100854*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 飞腾 平台 性能 计算 资源 监控 实现 方法 | ||
本发明涉及一种基于飞腾平台的高性能计算资源监控实现方法,属于高性能计算领域。本发明首先通过用户登录模块登录账号密码信息后进入到系统内部,通过计算节点确定模块确定高性能计算集群中的计算节点,并且在相应的计算节点上开启可监控模式,通过对高性能计算节点的运行特征的采集与处理,能够迅速且精确的得出应用程序对高性能计算硬件资源的需求量,同时也可以监控计算机集群的运行健康情况,有效实现了对高性能计算资源监控的完全覆盖,最大限度的发挥应用程序的性能,同时占用量低且不会影响应用程序的正常运行。
技术领域
本发明属于高性能计算领域,具体涉及一种基于飞腾平台的高性能计算资源监控实现方法。
背景技术
高性能计算指通常使用很多处理器(作为单个机器的一部分)或者某一集群中组织的几台计算机(作为单个计算资源操作)的计算系统和环境,有许多类型的HPC系统,其范围从标准计算机的大型集群,到高度专用的硬件,大多数基于集群的HPC系统使用高性能网络互连,比如那些来自InfiniBand或Myrinet的网络互连,基本的网络拓扑和组织可以使用一个简单的总线拓扑,在性能很高的环境中,网状网络系统在主机之间提供较短的潜伏期,所以可改善总体网络性能和传输速率。
目前针对高性能计算的监测工具难以满足精确的多节点监控要求,同时监测工具的占用量会对应用程序的正常运行造成影响,无法监控整个计算机集群的运行健康情况,导致应用程序性能发挥存在一定的局限性,因此针对上述不足,本发明提供了一种基于飞腾平台的高性能计算资源监控实现方法。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是如何提供一种基于飞腾平台的高性能计算资源监控实现方法,以解决现有监测工具难以满足精确的多节点监控要求,监测工具的占用量会对应用程序的正常运行造成影响,无法监控整个计算机集群的运行健康情况,导致应用程序性能发挥存在一定局限性的问题。
(二)技术方案
为了解决上述技术问题,本发明提出一种基于飞腾平台的高性能计算资源监控实现方法,该方法基于监控系统,该监控系统包括用户登录模块、控制端、开启指令发送模块、收集指令发送模块、腾云S系列服务器、存储单元、无线传输模块、监控中心、分析处理单元、实时监控单元以及计算节点确定模块,其中,分析处理单元包括运行特征参数采集模块、微处理器、参数库、计算模块、数值比较模块、类型区分单元和整理记录模块;该方法具体包括以下步骤:
S1、通过用户登录模块输入账号密码信息后登录进入到该监控系统,通过计算节点确定模块确定高性能计算集群中的计算节点,并且在相应的计算节点上开启可监控模式;用户通过控制端由开启指令发送模块向腾云S系列服务器发送监控开启指令,腾云S系列服务器向实时监控单元转发监控开启指令,实时监控单元接收到监控开启指令后,开始对计算节点的设备资源进行监控与数据提取,同时监听控制端的其它指令;
S2、达到了指定的时间间隔后,用户通过控制端由收集指令发送模块向腾云S系列服务器发送监控数据的收集指令,腾云S系列服务器向实时监控单元转发收集指令,实时监控单元接收到收集指令后,将在该时间段内的监控数据发送至分析处理单元;
S3、通过分析处理单元内部的运行特征参数采集模块计算获得计算节点的运行特征参数,将运行特征参数发送微处理器中,由微处理器将这些特征参数先发送至参数库内部进行保存;
S4、微处理器将运行特征参数发送至计算模块,通过计算模块计算收集到的运行特征参数的平均值或方差值,将计算结果作为运行特征值,通过数值比较模块将运行特征值与预先设置的参照标准进行对比,并计算两者的比值,类型区分单元根据比值判断该计算节点的程序为计算密集型应用还是约束型应用,通过整理记录模块将每个高性能计算节点的程序所属的类型进行整理记录并发送至存储单元内部进行保存;
S5、监控中心需要查看时,通过无线传输模块调取存储单元内部数据即可。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京计算机技术及应用研究所,未经北京计算机技术及应用研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210699362.9/2.html,转载请声明来源钻瓜专利网。