[发明专利]GPU集群功耗监控系统及其监控方法有效
申请号: | 201610506069.0 | 申请日: | 2016-07-01 |
公开(公告)号: | CN106066825B | 公开(公告)日: | 2018-10-12 |
发明(设计)人: | 陈庆奎;李超凡;曹渠成;易猛 | 申请(专利权)人: | 上海理工大学 |
主分类号: | G06F11/30 | 分类号: | G06F11/30 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 吴宝根 |
地址: | 200093 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种GPU集群功耗监控系统及其监控方法,涉及计算机技术领域,所解决的是监测GPU集群功耗的技术问题。该系统包括主监控终端、从监控终端、Zigbee协调器,及多个传感节点,由多个GPU构成的GPU集群;所述传感节点包括节点控制器,及分别连接节点控制器的霍尔电流传感器、Zigbee通信模块;所述Zigbee协调器通过通信线与主监控终端互联,各个传感节点中的Zigbee通信模块以Zigbee通信方式与Zigbee协调器互联;各个传感节点中的节点控制器通过通信线与从监控终端互联,各个传感节点中的霍尔电流传感器分别套置在各个GPU的供电线路上。本发明提供的系统,可以为GPU集群的功耗优化提供依据。 | ||
搜索关键词: | gpu 集群 功耗 监控 系统 及其 方法 | ||
【主权项】:
1.一种GPU集群功耗监控系统,其特征在于:所述GPU集群功耗监控系统包括主监控终端、从监控终端、Zigbee协调器,及多个传感节点,由多个GPU构成的GPU集群;所述传感节点包括节点控制器、霍尔电流传感器、Zigbee通信模块,其中的霍尔电流传感器接到节点控制器的电流采集端口,Zigbee通信模块通过通信线与节点控制器互联;所述Zigbee协调器通过通信线与主监控终端互联,各个传感节点中的Zigbee通信模块以Zigbee通信方式与Zigbee协调器互联;各个传感节点中的节点控制器通过通信线与从监控终端互联,各个传感节点中的霍尔电流传感器分别套置在各个GPU的供电线路上;所述GPU集群功耗监控系统能够进行监控步骤如下:为传感节点设定两种工作模式,其中的一种工作模式为无线模式,另一种工作模式为有线模式;主监控终端通过BGC数据包向Zigbee协调器下发控制指令,BGC数据包由wx、dm、ed组成,BGC数据包中的wx为工作模式指令,wx的值有两种,wx的两种值分别代表无线模式、有线模式,BGC数据包中的dm为传感节点采集GPU供电电流的采样间隔时间,ed为指令结束标识;传感节点工作在无线模式时通过BGA数据包向Zigbee协调器上传采集数据,BGA数据包为无线通信数据包,BGA数据包由st1、dev、val组成,BGA数据包中的st1为BGA数据包的起始标识,BGA数据包中的dev为传感节点的节点编号,BGA数据包中的val为霍尔电流传感器所测得的GPU供电电流数字量;Zigbee协调器通过BGP数据包向主监控终端上传采集数据,传感节点工作在有线模式时通过BGP数据包向从监控终端上传采集数据,BGP数据包为串行通信数据包,BGP数据包由st2、dev、val组成,BGP数据包中的st2为BGP数据包的起始标识,BGP数据包中的dev为传感节点的节点编号,BGP数据包中的val为霍尔电流传感器所测得的GPU供电电流数字量;Zigbee协调器与传感节点组网成功后,如果Zigbee协调器收到主监控终端发来的BGC数据包,则将BGC数据包发送给传感节点;传感节点收到Zigbee协调器发来的BGC数据包后,对BGC数据包中的wx的值进行判别;如果传感节点工作在有线模式,并且BGC数据包中的wx的值代表的是无线模式,则将传感节点的工作模式切换为无线模式;如果传感节点工作在无线模式,并且BGC数据包中的wx的值代表的是有线模式,则将传感节点的工作模式切换为有线模式;传感节点收到Zigbee协调器发来的BGC数据包后,将采集GPU供电电流的采样间隔时间设定为BGC数据包中的dm的值;传感节点与Zigbee协调器组网成功后,根据设定的采样间隔时间,通过节点中的霍尔电流传感器对GPU供电电流进行采集,并对采集到GPU供电电流模拟量进行模数转换;传感节点工作在无线模式时,将模数转换所得的GPU供电电流数字量与传感节点的节点编号封装成一个BGA数据包,然后再将封装好的BGA数据包发送给Zigbee协调器;Zigbee协调器对接收到的通信数据包进行检测,如果接收到的通信数据包是传感节点发送来的BGA数据包,则先从BGA数据包中提取dev及val,再将所提取的dev、val重新封装为BGP数据包,并将封装好的BGP数据包发送给主监控终端;主监控终端收到BGP数据包后,先从BGP数据包中提取dev及val,再将所提取的val中的小于0的异常值剔除后存储为M_cur,然后再将BGP数据包的接收时间、M_cur及所提取的dev封装为一个BGS数据包存储在本地;传感节点工作在有线模式时,将模数转换所得的GPU供电电流数字量与传感节点的节点编号封装为BGP数据包,并将封装好的BGP数据包发送给从监控终端;从监控终端收到BGP数据包后,先从BGP数据包中提取dev及val,再将所提取的val中的小于0的异常值剔除后存储为S_cur,然后再将BGP数据包的接收时间、S_cur及所提取的dev封装为一个BGS数据包存储在本地。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海理工大学,未经上海理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610506069.0/,转载请声明来源钻瓜专利网。
- 上一篇:故障维护管理系统及方法
- 下一篇:埋点的自动测试方法、装置以及终端