[发明专利]一种基于机器学习方式形成故障规则库的方法在审

专利信息
申请号: 201710828211.8 申请日: 2017-09-14
公开(公告)号: CN107644256A 公开(公告)日: 2018-01-30
发明(设计)人: 郭美思 申请(专利权)人: 郑州云海信息技术有限公司
主分类号: G06N5/02 分类号: G06N5/02;G06F11/07
代理公司: 济南信达专利事务所有限公司37100 代理人: 姜明
地址: 450000 河南省郑州市*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 机器 学习 方式 形成 故障 规则 方法
【说明书】:

技术领域

发明涉及计算机应用技术领域,特别涉及一种基于机器学习方式形成故障规则库的方法。

背景技术

随着时代的发展,人们生活水平的提高,人们的生活方式及工作方式都发生了变化,计算机已经成为人们日常生活中不可替代的设备。

当计算机出现故障时,技术人员只能通过查看日志信息进行排查,非常耗时。而且由于计算机操作系统组件相对比较复杂,产生的故障的原因有很多,日志信息数量巨大。当计算机出现故障时,需要技术人员手动查看日志信息进行分析,找到相应的故障信息,解决出现的故障问题,因此技术人员想要迅速确定故障原因是非常困难的。

现有技术没有使用通用的故障规则库,计算机发生故障时只能费时费力的人工排查。针对这种情况,本发明设计了一种基于机器学习方式形成故障规则库的方法。

发明内容

本发明为了弥补现有技术的缺陷,提供了一种简单高效的基于机器学习方式形成故障规则库的方法。

本发明是通过如下技术方案实现的:

一种基于机器学习方式形成故障规则库的方法,其特征在于,包括以下步骤:

(1)故障训练集选取,获取故障信息及解决方案,提炼出故障规则库字段;

(2)机器学习算法训练,采用随机森林算法,自动识别故障并挖掘故障现象与故障规则的关系;

(3)专家评判录入故障规则,对自动识别出的故障进行专家评审,将有效的故障现象及处理方案生成故障规则,存放到故障规则库中。

所述步骤(1)中,故障训练集选取是通过客户现场,研发部门,测试部门和运维人员获取的故障信息及解决方案,提炼出故障规则库字段;同时,训练集中的数据准确定位到具体设备,深入分析故障原因。

所述故障规则库字段包括故障名称,机器型号,操作系统,故障部位,故障模型,故障类型,日志级别,日志详细信息,关键字,日志路径,问题描述和解决办法。

训练集中的数据准确定位到CPU和内存故障时,读取CPU事件及内存事件,解析mcelog,定位故障CPU及内存位置;定位PCIE故障,读取PCIE事件,根据机器丝印对照表,匹配出对应的插槽信息;定位CallTrace故障报错程序段,分析CallTrace事件日志,挖掘函数调用栈,深入分析故障原因。

所述步骤(2)中,机器学习算法训练,采用随机森林算法,生成由决策树组成的森林,对故障信息进行归并处理,通过多棵决策树对故障现象进行投票,判断故障,并采取相应的解决办法。

本发明的有益效果:该基于机器学习方式形成故障规则库的方法,根据日常故障的规律及处理办法形成一个故障规则库,当故障再次发生时,查看故障规则库中的信息即可找到相应的解决办法,大大提高了故障排查的效率。

附图说明

附图1为本发明基于机器学习方式形成故障规则库的方法示意图。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图和实施例,对本发明进行详细的说明。应当说明的是,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

该基于机器学习方式形成故障规则库的方法,包括:故障训练集选取,机器学习算法训练和专家评判录入故障规则三部分。

所述故障训练集选取是指通过客户现场、研发部门、测试部门、运维人员获取的故障信息及解决方案,提炼出故障规则库字段,保证故障诊断的完备性和精确性;训练集中的数据准确定位到具体设备,例如定位CPU和内存故障时,读取CPU事件及内存事件,解析mcelog,定位故障CPU及内存位置;定位PCIE故障,读取PCIE事件,根据机器丝印对照表,匹配出对应的插槽信息;定位CallTrace故障报错程序段,分析CallTrace事件日志,挖掘函数调用栈,深入分析故障原因。

故障规则库字段包括故障名称、机器型号、操作系统、故障部位、故障模型、故障类型、日志级别、日志详细信息、关键字、日志路径、问题描述、解决办法。

所述机器学习算法训练是指采用随机森林算法,实现故障的自动识别,挖掘故障现象与故障规则的关系。基于随机森林算法规则,生成由决策树组成的森林,对故障信息进行归并处理,通过多棵决策树对故障现象进行投票,判断故障,采取相应的措施。采用机器学习算法训练的方法自动识别故障,将人工完成的事情交给系统自动完成,能够节省运维成本,提高工作效率。

所述专家评判录入故障规则是指对自动识别出的故障进行专家评审,将有效的故障现象及处理方案生成故障规则,存放到故障规则库中。当故障再次发生的时候,查看故障规则库中的信息即可找到相应的解决方案,大大提高了故障排查的效率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710828211.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top