[发明专利]一种系统异常的捕获方法、主系统、影子系统及智能设备在审
申请号: | 201410307724.0 | 申请日: | 2014-06-30 |
公开(公告)号: | CN105204977A | 公开(公告)日: | 2015-12-30 |
发明(设计)人: | 蒋彪 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G06F11/34 | 分类号: | G06F11/34 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;黄灿 |
地址: | 518057 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 系统 异常 捕获 方法 影子 智能 设备 | ||
技术领域
本发明涉及计算机操作系统技术领域,特别是一种系统异常的捕获方法、主系统、影子系统及智能设备。
背景技术
随着计算机软硬件技术的飞速发展,操作系统运行的硬件环境和业务程序日趋复杂,在实际应用中,经常会遇到系统死机的情况,可能的表现为:键盘、鼠标无响应、无法ping通、显示器无法点亮或者显示上无法显示异常信息、同时系统日志也无法记录到有效的故障信息,此时环境可能完全失去响应,无法操作。此类问题的分析定位一直是业界的一大难题。
现有的操作系统中存在一些针对死机问题的定位手段,如Linux操作系统的kdump技术能捕获到操作系统内核软件异常、Linux操作系统的nmi_watchdog技术能捕获到内核中断死锁异常、Linux操作系统的watchdog技术能捕获到内核调度异常,但对于如下原因导致的死机异常,却无法捕获到有效信息:
1、CPU硬件故障导致操作系统挂死。这种情况下,CPU硬件直接挂死,导致运行在该CPU上操作系统直接挂死,从而无法记录到有效信息。
2、内存硬件故障导致操作系统挂死。这种情况下,内存硬件故障导致操作系统直接挂死,从而无法记录到有效信息。
3、PCI(PeripheralComponentInterconnect,外设部件互连标准)设备硬件或固件故障导致PCI总线挂死,最终导致操作系统挂死。这种情况下,无法记录有效信息。
4、硬盘硬件或固件故障导致操作系统挂死。这种情况下,由于硬盘故障导致系统I/O(输入/输出)挂死,无法记录日志。
5、系统负荷过重导致操作系统挂死,比如内存耗尽。这种情况下,导致操作系统无法执行记录异常信息相关的操作。
6、高优先级任务持续占用CPU导致其他低优先级任务无法得到调度,最终导致操作系统挂死。这种情况下,系统仅能调度高优先级任务执行,而记录异常信息相关的低级进程无法得到调度,从而无法记录到有效信息。
7、软中断处理过程中出现死锁,导致其他任务无法得到调度,最终导致操作系统挂死。这种情况下,由于记录异常信息相关的进程无法得到调度,从而无法记录到有效信息。
针对上述问题,不难想到的是配置一个专业化的监测设备,用于实时捕获被监测设备的异常信息。即被监测设备的系统死机后,不会影响到监测设备的异常捕获。但是,该方案由于额外配置了监测设备,因此不具备适用性。
发明内容
本发明要解决的技术问题是提供一种系统异常的捕获方法、主系统、影子系统及智能设备,能够一个硬件化境下独立运行主系统以及影子系统,在主系统瘫痪后,影子系统依然能够捕获主系统的异常信息。
为解决上述技术问题,本发明的实施例提供一种系统异常的捕获方法,应用于主系统,包括:
主系统在一硬件环境的第二硬件资源上启动一用于对主系统进行异常检测的影子系统;所述第二硬件资源与主系统运行在所述硬件环境的第一硬件资源不同;
主系统将自己的运行状态信息动态保存在一共享内存中,使得影子系统在监测出主系统异常时,从所述共享内存中获取到主系统的运行状态信息;
主系统将自己的物理内存地址保存在所述共享内存中,使得影子系统在监测出主系统异常时,能够通过所述共享内存中的物理内存地址访问主系统的物理内存,并获取到主系统使用物理内存的信息。
其中,所述应用于主系统的捕获方法还包括:
主系统对影子系统进行异常监测;
当主系统监测出影子系统异常时,主系统对影子系统进行复位。
其中,主系统在硬件环境的第二硬件资源上启动一用于对主系统进行异常检测的影子系统的步骤包括:
主系统将影子系统的内核加载到影子系统的物理内存中;
主系统根据第二硬件资源的信息配置影子系统的系统内核的启动参数;
主系统将分配给影子系统的CPU跳转到影子系统的物理内存,从而使该分配给影子系统的CPU运行所述系统内核,以启动影子系统。
其中,所述应用于主系统的捕获方法还包括:
主系统将支持心跳报文检测的第一硬件资源的信息保存在所述共享内存中,使得影子系统能够根据所述共享内存确定出支持心跳报文检测的第一硬件资源,并与支持心跳报文检测的第一硬件资源建立心跳报文检测机制,以实现对主系统的异常监测。
其中,所述应用于主系统的捕获方法还包括:
主系统通过软看门狗对用户态进程进行计数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410307724.0/2.html,转载请声明来源钻瓜专利网。