[发明专利]基于机器学习预测CPU故障的方法及系统在审
申请号: | 201810516634.0 | 申请日: | 2018-05-25 |
公开(公告)号: | CN108763002A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 左聪越 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22;G06F11/26;G06N99/00 |
代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 黄晓燕 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于机器 预测模型 训练数据集 故障预测 学习算法 建立服务器 健康状况 输入标签 特征信息 训练建模 应对措施 预测 获知 学习 监督 | ||
本发明实施例公开了基于机器学习预测CPU故障的方法及系统,方法包括获取不同CPU的特征信息,形成训练数据集;对所述训练数据集,结合输入标签值,利用监督式学习算法进行训练建模,得到CPU故障的预测模型;利用所述预测模型,对CPU进行故障预测。本发明基于机器学习算法,建立服务器CPU故障的预测模型,利用该模型对CPU进行故障预测,提前获知CPU的健康状况,便于及时采取相关的应对措施,降低风险和危害。
技术领域
本发明涉及计算机技术领域,具体地说是基于机器学习预测CPU故障的方法及系统。
背景技术
随着大数据时代的到来,作为计算平台核心的服务器,其可靠性、稳定性正接受着种种考验。CPU作为服务器的核心组成部分,承担着解释计算机指令以及处理计算机软件中的数据的重要作用,如果CPU发生故障,将导致服务器的可靠性会下降,甚至给用户带来损失。
现有技术中,缺乏对CPU故障预测的相关技术,只能在CPU实际出现故障时采取相应的应对措施。对重要服务器上的CPU通常根据往常的经验,根据CPU的工作时长,定期的进行维护或更换,成本较高。且在CPU发生意外故障时,往往对用户造成巨大损失。
发明内容
本发明实施例中提供了基于机器学习预测CPU故障的方法及系统,以解决现有技术中缺乏对CPU故障进行预测,使用成本高的问题。
为了解决上述技术问题,本发明实施例公开了如下技术方案:
本发明第一方面提供了基于机器学习预测CPU故障的方法,包括以下步骤:
获取不同CPU的特征信息,形成训练数据集;
对所述训练数据集,结合输入标签值,利用监督式学习算法进行训练建模,得到CPU故障的预测模型;
利用所述预测模型,对CPU进行故障预测。
结合第一方面,在第一方面第一种可能的实现方式中,所述获取不同CPU的特征信息,形成训练数据集的具体过程为:
在操作系统下运行信息采集工具,获取服务器上CPU的特征信息;
生成日志文件,将所述特征信息存储在日志文件中,作为训练数据集;
根据所述训练数据集,定义特征值。
结合第一方面,在第一方面第一种可能的实现方式中,信息采集工具支持远程采集和本地采集,远程采集时通过输入目标服务器的BMC IP,获取远程服务器的CPU特征信息。
结合第一方面,在第一方面第二种可能的实现方式中,对所述训练数据集,结合输入标签值,利用监督式学习算法进行训练建模,得到CPU故障的预测模型的具体过程为:
利用sklearn中的preproccessing库进行数据的预处理;
结合输入标签值,对预处理过的数据利用sklearn中的监督式学习算法创建模型。
结合第一方面,在第一方面第二种可能的实现方式中,创建预测模型后还包括步骤:利用sklearn中的metrics模块对模型进行评估,得到预测模型。
结合第一方面,在第一方面第二种可能的实现方式中,对数据进行的预处理包括对定量特征二值化和对定性特征独热编码。
结合第一方面,在第一方面第三种可能的实现方式中,利用所述预测模型,对CPU进行故障预测的具体过程为:
将所述预测模型部署到故障预测服务器上;
运行信息采集工具,获取待预测服务器的CPU特征信息,并上传至故障预测服务器;
根据所述预测模型,对待预测服务器的CPU健康状态进行评估,得到CPU的故障预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810516634.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通用串行总线测试发包方法
- 下一篇:一种测试方法、装置和系统