[发明专利]集群故障修复方法及其模型训练方法、装置及服务器在审
申请号: | 202010120742.3 | 申请日: | 2020-02-26 |
公开(公告)号: | CN113313134A | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 李睿;羌毅;王冕;何诚 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F11/30;G06F16/18 |
代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 郭少晶 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 集群 故障 修复 方法 及其 模型 训练 装置 服务器 | ||
1.一种集群故障修复模型的训练方法,包括:
获取故障日志数据;所述故障日志数据中包括历史故障数据和历史故障修复策略;
根据所述历史故障数据形成故障文本;
将所述故障文本表示为结构化的文本表示向量;
将所述文本表示向量输入多层分类器,输出所述文本表示向量与所述历史故障修复策略之间的关联关系,得到所述集群故障修复模型。
2.根据权利要求1所述的方法,其中,所述根据所述历史故障数据形成故障文本,包括:
从所述历史故障数据中提取故障监控模块名称以及对应的故障级别;
使所述故障监控模块名称及对应的故障级别形成所述故障文本。
3.根据权利要求2所述的方法,其中,所述将所述故障文本表示为结构化的文本表示向量,包括:
根据预设故障级别权重值,将所述故障文本转化为相应的词频向量;
将所述词频向量输入语言模型,得到所述结构化的文本表示向量。
4.根据权利要求3所述的方法,其中,所述语言模型为概率统计模型或深度学习语言模型;其中,所述概率统计模型包括词频-逆向文件频率tf-idf模型、文档主题生成模型LDA;所述深度学习语言模型为word2vec模型。
5.根据权利要求1所述的方法,其中,所述历史故障修复策略包括成功修复策略和未成功修复策略;
所述将所述文本表示向量输入多层分类器,输出所述文本表示向量与所述历史故障修复策略之间的关联关系,包括:
将所述文本表示向量输入多分类器,输出所述文本表示向量与所述成功修复策略之间的关联关系;
以及,将所述文本表示向量输入二分类器,输出所述文本表示向量与所述成功修复策略以及所述未成功修复策略之间的关联关系。
6.一种集群故障修复方法,包括:
获取待修复故障数据;
将所述待修复故障数据输入集群故障修复模型,输出对应的故障修复策略;
其中,所述集群故障修复模型是根据历史故障数据形成故障文本,将所述故障文本表示为结构化的文本表示向量,并将所述文本表示向量输入多层分类器进行训练,输出与历史故障修复策略之间的关联关系后得到的。
7.根据权利要求6所述的方法,其中,所述输出对应的故障修复策略之后,方法还包括:
将所述待修复故障数据及对应的故障修复策略存储至预设故障知识库中。
8.一种集群故障修复模型的训练装置,包括:
获取模块,用于获取故障日志数据;所述故障日志数据中包括历史故障数据和历史故障修复策略;
形成模块,用于根据所述历史故障数据形成故障文本;
表示模块,用于将所述故障文本表示为结构化的文本表示向量;
训练模块,用于将所述文本表示向量输入多层分类器,输出所述文本表示向量与所述历史故障修复策略之间的关联关系,得到所述集群故障修复模型。
9.一种集群故障修复装置,包括:
获取模块,用于获取待修复故障数据;
输出模块,用于将所述待修复故障数据输入集群故障修复模型,输出对应的故障修复策略;
其中,所述集群故障修复模型是根据历史故障数据形成故障文本,将所述故障文本表示为结构化的文本表示向量,并将所述文本表示向量输入多层分类器进行训练,输出与历史故障修复策略之间的关联关系后得到的。
10.一种服务器,包括如权利要求8所述的集群故障修复模型的训练装置,或者,所述服务器包括:
存储器,用于存储可执行命令;
处理器,用于在所述可执行命令的控制下,执行如权利要求1-5中任一项所述的集群故障修复模型的训练方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010120742.3/1.html,转载请声明来源钻瓜专利网。