[发明专利]一种基于监督学习的服务器错误诊断方法在审
申请号: | 201810501684.1 | 申请日: | 2018-05-23 |
公开(公告)号: | CN108710555A | 公开(公告)日: | 2018-10-26 |
发明(设计)人: | 梁盛楠 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22;G06F11/26;G06F11/30;G06N3/08 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 王守梅 |
地址: | 450000 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 服务器 错误诊断 故障预测模型 预测 监督 学习 服务器故障 自动化分析 高效算法 故障信息 日志内容 时间成本 自动分析 检测 分析 | ||
本发明公开了一种基于监督学习的服务器错误诊断方法,具体方法为利用海量的故障信息训练监督学习模型,生成故障预测模型,并利用故障预测模型对服务器的错误进行预测分析。本发明的一种基于监督学习的服务器错误诊断方法破除了传统设定阈值来检测故障的方法,利用高效算法自动分析并预测日志内容,解放人工服务器故障的时间成本,完全自动化分析及预测故障等级。
技术领域
本发明涉及服务器故障管理技术领域,具体地说是一种基于监督学习的服务器错误诊断方法。
背景技术
一台正在运行的服务器上每时每刻都在承载着无数的业务流量,会产生大量数据。虽然服务器作为一个非常稳定的产品,但是随着运行时间的增加,以及周围物理环境的变化(比如散热等),不可避免的会给服务器带来一定的影响,严重者甚至可能会给服务器带来宕机的风险,因此能够对服务器上可能出现的各种故障进行预测,成为一个非常有价值的研究方向。
目前对服务器进行故障分析,一般对特定的指标进行性监控,比如温度、风扇转速以及一些其他的硬件活软件指标,设定一定的阈值,进行判断,超出一定的界限后则服务器会自动上报故障。
但是,存在的弊端如下:
1、这种设定固定值来检测故障的方法非常不灵活,适应多种设备,必须针对不同的环境进行不同的配置,比较繁琐。
发明内容
本发明的技术任务是针对以上不足之处,提供一种简单高效的一种基于监督学习的服务器错误诊断方法。
本发明解决其技术问题所采用的技术方案是:一种基于监督学习的服务器错误诊断方法,所述的方法应用在服务器系统上,利用海量的故障信息训练监督学习模型,生成故障预测模型,并利用故障预测模型对服务器的错误进行预测分析。
进一步的,优选的方法为:
S1、收集服务器故障信息;
S2、将收集的故障信息进行分类,先按照故障类型进行分类,然后每种类型的故障信息再分为输入组和输出组两部分;
S3、将收集的故障信息分为训练集和测试集;
S4、把输入组和输出组两部分故障信息组织为监督学习模型;
S5、利用训练集对监督学习模型进行训练,利用测试集测试监督学习模型的精度;
S6、筛选精度较高的监督学习模型作为故障预测模型;
S7、利用故障预测模型对服务器的错误进行预测分析。
进一步的,优选的方法为:所述的监督学习模型为最邻近节点算法或逻辑回归算法。
进一步的,优选的方法为:所述的最邻近节点算法的具体步骤如下:
S41、准备数据,对数据进行预处理;
S42、选用合适的数据结构存储训练数据和测试元组;
S43、设定参数为K;
S44、维护一个大小为k的的按距离由大到小的优先级队列,用于存储最近邻训练元组;随机从训练元组中选取k个元组作为初始的最近邻元组,分别计算测试元组到这k个元组的距离,将训练元组标号和距离存入优先级队列;
S45、遍历训练元组集,计算当前训练元组与测试元组的距离,将所得距离 L与优先级队列中的最大距离Lmax;
S46、进行比较,若L>=Lmax,则舍弃该元组,遍历下一个元组;若L<Lmax,删除优先级队列中最大距离的元组,将当前训练元组存入优先级队列;
S47、遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810501684.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:处理器侦错系统及方法
- 下一篇:一种对工件进行检测的装置