[发明专利]一种基于linux操作系统信息自动分析故障的方法在审
申请号: | 201710827649.4 | 申请日: | 2017-09-14 |
公开(公告)号: | CN107608813A | 公开(公告)日: | 2018-01-19 |
发明(设计)人: | 郭美思;周国浪 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 济南信达专利事务所有限公司37100 | 代理人: | 姜明 |
地址: | 450000 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 linux 操作系统 信息 自动 分析 故障 方法 | ||
技术领域
本发明涉及计算机应用技术领域,特别涉及一种基于linux操作系统信息自动分析故障的方法。
背景技术
随着时代的发展,人们生活水平的提高,人们的生活方式及工作方式都发生了变化,计算机已经成为人们日常生活中不可替代的设备。
用户可以利用计算机应用软件进行办公,操作计算机。而应用软件是在操作系统支持下才能运行,操作系统是用户和计算机的接口,同时也是计算机硬件和其他软件的接口。操作系统有关的数据可以提供给用户用于分析解决问题。
但是由于操作系统组件相对比较复杂,产生的故障的原因有很多,操作系统信息数量巨大。当计算机出现故障时,需要技术人员手动查看操作系统信息进行分析,找到相应的故障信息,解决出现的故障问题,因此技术人员想要迅速确定故障原因是非常困难的。
人工分析大量的操作系统信息,不仅费时费力费钱,而且效率低下。针对这种情况,本发明设计了一种基于linux操作系统信息自动分析故障的方法。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单高效的基于linux操作系统信息自动分析故障的方法。
本发明是通过如下技术方案实现的:
一种基于linux操作系统信息自动分析故障的方法,其特征在于,包括以下步骤:
(1)获取linux操作系统信息;
(2)根据不同故障类别及故障部件形成故障规则库;
(3)根据故障规则库中的故障规则对操作系统信息进行自动分析,当匹配到对应故障规则后,给出问题描述及故障解决办法,并保存分析结果。
所述步骤(1)中,linux操作系统信息包括CPU信息,内存信息,BIOS信息,磁盘信息,驱动信息,网卡信息,BMC信息和RAID信息。
所述CPU信息收集包括概要信息及详细信息,使用lscpu命令、dmidecode –t processor命令和cat /proc/cpuinfo命令;所述内存信息收集使用free命令、 dmidecode –t memory命令和cat /proc/meminfo命令;所述BIOS信息收集使用dmidecode –t bios命令;所述磁盘信息收集使用lsblk、lsscsi、df –h、mount、fdisk –l、smartctl命令;所述驱动信息收集使用lsmod命令;所述网卡信息收集使用ifconfig、lspci命令;所述BMC信息收集使用ipmitool命令;所述RAID信息收集通过不同类型RAID指定工具进行收集。
所述步骤(2)中,随时获取故障信息及解决方案,提炼出故障规则库字段;然后采用随机森林算法,自动识别故障并挖掘故障现象与故障规则的关系,并对自动识别出的故障进行专家评审,将有效的故障现象及处理方案生成故障规则,存放到故障规则库中。
通过客户现场,研发部门,测试部门和运维人员获取的故障信息及解决方案,提炼出故障规则库字段;同时,训练集中的数据准确定位到具体设备,深入分析故障原因。
所述故障规则库字段包括机器型号,操作系统,故障类别,故障部件,日志级别,日志详细信息,关键字,日志路径,问题描述和解决办法。
训练集中的数据准确定位到CPU和内存故障时,读取CPU事件及内存事件,解析mcelog,定位故障CPU及内存位置;定位PCIE故障,读取PCIE事件,根据机器丝印对照表,匹配出对应的插槽信息;定位CallTrace故障报错程序段,分析CallTrace事件日志,挖掘函数调用栈,深入分析故障原因。
采用随机森林算法,生成由决策树组成的森林,对故障信息进行归并处理,通过多棵决策树对故障现象进行投票,判断故障,并采取相应的解决办法。
所述步骤(3)中,当操作系统信息中出现内存错误时,故障类别是system;故障部件是Memory;日志级别是critical;关键字是Memory Controller,Err;日志路径是/var/log/mcelog;问题描述是内存控制器故障;解决方法是内存故障,确认具体内存位置后更换内存。
本发明的有益效果:该基于linux操作系统信息自动分析故障的方法,获取linux操作系统信息并根据日常故障的规律及处理办法形成一个故障规则库,当linux操作系统出现故障时,查看故障规则库中的信息即可找到相应的解决办法,大大提高了故障排查的效率。
附图说明
附图1为本发明基于linux操作系统信息自动分析故障的方法示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710827649.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种熔断方法和服务器
- 下一篇:一种数据共享的方法、数据共享的装置及移动终端
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置