[发明专利]一种异构芯片的监控方法、装置、设备和介质在审
申请号: | 202111641730.6 | 申请日: | 2021-12-29 |
公开(公告)号: | CN114328112A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 张家华 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 郄晨芳 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 芯片 监控 方法 装置 设备 介质 | ||
1.一种异构芯片的监控方法,其特征在于,包括:
获取每个节点包含的异构芯片的芯片类型;
基于所述芯片类型,从设定的配置文件中确定出对应的指标类型;
按照所述配置文件中记录的各所述指标类型的生成方式,得到各所述异构芯片对应的指标信息;
调用设定的监控告警规则对所述指标信息进行分析,以得到监测结果。
2.根据权利要求1所述的异构芯片的监控方法,其特征在于,所述按照所述配置文件中记录的各所述指标类型的生成方式,得到各所述异构芯片对应的指标信息包括:
在所述指标类型为直接获取型指标的情况下,调用所述配置文件中与所述指标类型对应的指令,以获取指标信息;
在所述指标类型为计算型指标的情况下,按照所述配置文件中所述指标类型对应的处理规则,计算得到指标信息。
3.根据权利要求1所述的异构芯片的监控方法,其特征在于,所述监控告警规则包括有各所述指标信息对应的正常范围以及告警方式;
所述调用设定的监控告警规则对所述指标信息进行分析,以得到监测结果包括:
判断各所述指标信息是否属于其对应的正常范围内;
当存在不属于正常范围的异常指标信息时,依据所述异常指标信息对应的告警方式,通过推理平台进行告警提示。
4.根据权利要求1所述的异构芯片的监控方法,其特征在于,在所述按照所述配置文件中记录的各所述指标类型的生成方式,得到各所述异构芯片对应的指标信息之后还包括:
将各所述异构芯片对应的指标信息存储至Prometheus服务器。
5.根据权利要求4所述的异构芯片的监控方法,其特征在于,还包括:
将异构芯片厂商对应的指标标识发送至推理平台,以便于所述异构芯片厂商基于所述推理平台查询异构芯片对应的指标信息;
依据所述推理平台传输的携带有指标标识的信息获取指令,从所述Prometheus服务器读取对应的目标指标信息,将所述目标指标信息反馈至所述推理平台。
6.根据权利要求1所述的异构芯片的监控方法,其特征在于,还包括:
接收配置文件修改指令,对所述配置文件中包含的指标类型和/或指标类型的生成方式进行修改。
7.根据权利要求1至6任意一项所述的异构芯片的监控方法,其特征在于,所述异构芯片对应的指标信息包括所述异构芯片的状态信息、温度信息、功率信息、使用率信息和进程信息的任意一个或任意组合。
8.一种异构芯片的监控装置,其特征在于,包括获取单元、确定单元、生成单元和分析单元;
所述获取单元,用于获取每个节点包含的异构芯片的芯片类型;
所述确定单元,用于基于所述芯片类型,从设定的配置文件中确定出对应的指标类型;
所述生成单元,用于按照所述配置文件中记录的各所述指标类型的生成方式,得到各所述异构芯片对应的指标信息;
所述分析单元,用于调用设定的监控告警规则对所述指标信息进行分析,以得到监测结果。
9.一种异构芯片的监控设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现如权利要求1至7任意一项所述异构芯片的监控方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述异构芯片的监控方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111641730.6/1.html,转载请声明来源钻瓜专利网。