[发明专利]一种智能网卡的故障诊断方法、装置、设备及可读介质在审
申请号: | 202111112126.4 | 申请日: | 2021-09-18 |
公开(公告)号: | CN113852502A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 孙崇雨;高磊;刘齐 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 刘小峰;杨帆 |
地址: | 215000 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 网卡 故障诊断 方法 装置 设备 可读 介质 | ||
本发明公开了一种智能网卡的故障诊断方法,包括以下步骤:响应于接收到故障诊断指令,由主机端对PCIE链路和NCSI通道进行诊断,判断所述PCIE链路和所述NCSI通道是否存在异常;若是所述PCIE链路和所述NCSI通道均不存在异常,则由智能网卡端进行自诊断;以及若是通过自诊断识别到异常信息,则记录异常信息并与本地故障库进行比对,并提供故障排除建议。本发明还公开了一种智能网卡的故障诊断装置、计算机设备和可读存储介质。本发明使智能网卡在工作状态进行故障诊断,达到在线诊断的目的,无需掉电拆机,提高运维效率;同时可以区分故障类型属于硬件故障还是软件故障,达到软硬件解耦的目的。
技术领域
本发明涉及故障诊断技术领域,尤其涉及一种智能网卡的故障诊断方法、装置、设备及可读介质。
背景技术
在云计算的环境下,智能网卡可以将网络报文处理工作从服务器主机CPU上释放出来,将网络处理卸载到智能网卡上,充分释放服务器主机CPU的算力资源。智能网卡集成度高,各个器件之间紧密耦合,智能网卡上既要运行客户定制化程序,还要支持软件、固件升级功能。
智能网卡上限运行后,如果在运行过程中发生了故障,如何在不拆机不掉电的情况下快速定位故障类型,对运维工作具有重要意义。智能网卡属于新兴事物,需要搭配服务器运行,一线运维工程师尚未全面建立起针对智能网卡的故障诊断规则。
传统的对智能网卡的故障排查往往是通过带内或带外的方式,收集智能网卡产生的日志,通过查看日志中的报错信息,判断智能网卡产生的故障,并给出解决建议。一些硬件故障的排查需要将服务器断电拆机,将智能网卡拆解下来进行故障分析。传统的系统日志分析的方法,不能全面、快速且准确的定位到故障点;将服务器断电拆机进行分析的方法,会影响数据中心的运行效率;同时,智能网卡是需要搭配服务器运行的,智能网卡产生的日志信息不能覆盖整个服务器系统的故障信息。
发明内容
有鉴于此,本发明实施例的目的在于提出一种智能网卡的故障诊断方法、装置、设备及可读介质,使智能网卡在工作状态进行故障诊断,达到在线诊断的目的,无需掉电拆机,提高运维效率;同时可以区分故障类型属于硬件故障还是软件故障,达到软硬件解耦的目的;最后还可以准确的定位故障点,并基于本地故障库给出故障排除建议,降低对运维人员的要求。
基于上述目的,本发明实施例的一方面提供了一种智能网卡的故障诊断方法,包括以下步骤:响应于接收到故障诊断指令,由主机端对PCIE链路和NCSI通道进行诊断,判断所述PCIE链路和所述NCSI通道是否存在异常;若是所述PCIE链路和所述NCSI通道均不存在异常,则由智能网卡端进行自诊断;以及若是通过自诊断识别到异常信息,则记录异常信息并与本地故障库进行比对,并提供故障排除建议。
在一些实施方式中,由智能网卡端进行自诊断包括:由智能网卡端接收诊断指令,并进行快速检测;若是快速检测识别到异常,则进行详细诊断,并记录报错点具体的异常信息。
在一些实施方式中,由智能网卡端进行自诊断包括:对下挂器件的健康诊断、压力测试,对链路连通性诊断,对固件版本检查。
在一些实施方式中,对PCIE链路和NCSI通道进行诊断,判断所述PCIE链路和所述NCSI通道是否存在异常包括:对PCIE链路进行诊断,判断所述PCIE链路是否存在异常;若是所述PCIE链路不存在异常,进一步对NCSI通道进行诊断,判断所述NCSI通道是否存在异常。
在一些实施方式中,对PCIE链路进行诊断包括:获取PCIE插槽信息,对智能网卡ID、链路速率、链路带宽、UE/CE错误进行检查,并进行DMA压力测试;进一步对NCSI通道进行诊断包括:对网络连通状态、NCSI通用串行总线、NCSI通用异步收发传输器进行检查,并进行NCSI网络通道加压测试。
在一些实施方式中,方法还包括:若是所述PCIE链路和/或所述NCSI通道存在异常,则将异常信息上报给运维人员以决定是否需要由智能网卡端进行自诊断。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111112126.4/2.html,转载请声明来源钻瓜专利网。