[发明专利]一种基于机器学习方式形成故障规则库的方法在审
申请号: | 201710828211.8 | 申请日: | 2017-09-14 |
公开(公告)号: | CN107644256A | 公开(公告)日: | 2018-01-30 |
发明(设计)人: | 郭美思 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;G06F11/07 |
代理公司: | 济南信达专利事务所有限公司37100 | 代理人: | 姜明 |
地址: | 450000 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 方式 形成 故障 规则 方法 | ||
技术领域
本发明涉及计算机应用技术领域,特别涉及一种基于机器学习方式形成故障规则库的方法。
背景技术
随着时代的发展,人们生活水平的提高,人们的生活方式及工作方式都发生了变化,计算机已经成为人们日常生活中不可替代的设备。
当计算机出现故障时,技术人员只能通过查看日志信息进行排查,非常耗时。而且由于计算机操作系统组件相对比较复杂,产生的故障的原因有很多,日志信息数量巨大。当计算机出现故障时,需要技术人员手动查看日志信息进行分析,找到相应的故障信息,解决出现的故障问题,因此技术人员想要迅速确定故障原因是非常困难的。
现有技术没有使用通用的故障规则库,计算机发生故障时只能费时费力的人工排查。针对这种情况,本发明设计了一种基于机器学习方式形成故障规则库的方法。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单高效的基于机器学习方式形成故障规则库的方法。
本发明是通过如下技术方案实现的:
一种基于机器学习方式形成故障规则库的方法,其特征在于,包括以下步骤:
(1)故障训练集选取,获取故障信息及解决方案,提炼出故障规则库字段;
(2)机器学习算法训练,采用随机森林算法,自动识别故障并挖掘故障现象与故障规则的关系;
(3)专家评判录入故障规则,对自动识别出的故障进行专家评审,将有效的故障现象及处理方案生成故障规则,存放到故障规则库中。
所述步骤(1)中,故障训练集选取是通过客户现场,研发部门,测试部门和运维人员获取的故障信息及解决方案,提炼出故障规则库字段;同时,训练集中的数据准确定位到具体设备,深入分析故障原因。
所述故障规则库字段包括故障名称,机器型号,操作系统,故障部位,故障模型,故障类型,日志级别,日志详细信息,关键字,日志路径,问题描述和解决办法。
训练集中的数据准确定位到CPU和内存故障时,读取CPU事件及内存事件,解析mcelog,定位故障CPU及内存位置;定位PCIE故障,读取PCIE事件,根据机器丝印对照表,匹配出对应的插槽信息;定位CallTrace故障报错程序段,分析CallTrace事件日志,挖掘函数调用栈,深入分析故障原因。
所述步骤(2)中,机器学习算法训练,采用随机森林算法,生成由决策树组成的森林,对故障信息进行归并处理,通过多棵决策树对故障现象进行投票,判断故障,并采取相应的解决办法。
本发明的有益效果:该基于机器学习方式形成故障规则库的方法,根据日常故障的规律及处理办法形成一个故障规则库,当故障再次发生时,查看故障规则库中的信息即可找到相应的解决办法,大大提高了故障排查的效率。
附图说明
附图1为本发明基于机器学习方式形成故障规则库的方法示意图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图和实施例,对本发明进行详细的说明。应当说明的是,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
该基于机器学习方式形成故障规则库的方法,包括:故障训练集选取,机器学习算法训练和专家评判录入故障规则三部分。
所述故障训练集选取是指通过客户现场、研发部门、测试部门、运维人员获取的故障信息及解决方案,提炼出故障规则库字段,保证故障诊断的完备性和精确性;训练集中的数据准确定位到具体设备,例如定位CPU和内存故障时,读取CPU事件及内存事件,解析mcelog,定位故障CPU及内存位置;定位PCIE故障,读取PCIE事件,根据机器丝印对照表,匹配出对应的插槽信息;定位CallTrace故障报错程序段,分析CallTrace事件日志,挖掘函数调用栈,深入分析故障原因。
故障规则库字段包括故障名称、机器型号、操作系统、故障部位、故障模型、故障类型、日志级别、日志详细信息、关键字、日志路径、问题描述、解决办法。
所述机器学习算法训练是指采用随机森林算法,实现故障的自动识别,挖掘故障现象与故障规则的关系。基于随机森林算法规则,生成由决策树组成的森林,对故障信息进行归并处理,通过多棵决策树对故障现象进行投票,判断故障,采取相应的措施。采用机器学习算法训练的方法自动识别故障,将人工完成的事情交给系统自动完成,能够节省运维成本,提高工作效率。
所述专家评判录入故障规则是指对自动识别出的故障进行专家评审,将有效的故障现象及处理方案生成故障规则,存放到故障规则库中。当故障再次发生的时候,查看故障规则库中的信息即可找到相应的解决方案,大大提高了故障排查的效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710828211.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种红绿灯自动路障器
- 下一篇:一种减速带