[发明专利]一种特征提取模型训练方法及设备在审
申请号: | 201911252002.9 | 申请日: | 2019-12-09 |
公开(公告)号: | CN111178537A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 覃元元 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F11/36 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 赵小霞 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 提取 模型 训练 方法 设备 | ||
1.一种特征提取模型训练方法,其特征在于,所述方法包括:
获取待训练样本,其中,所述待训练样本中包含日志文本、实际问题类别和实际问题根因;
将所述日志文本输入所述特征提取模型,得到第一日志特征向量;将所述实际问题根因输入所述特征提取模块,得到第一根因特征向量;
将所述第一日志特征向量输入分类器模型,得到预测问题类别;
将所述第一日志特征向量和所述第一根因特征向量进行匹配,得到匹配结果;
根据所述预测问题类别和所述实际问题类别,以及所述匹配结果,对所述特征提取模型的参数进行调整。
2.如权利要求1所述的方法,其特征在于,将所述第一日志特征向量和所述第一根因特征向量进行匹配,得到匹配结果,包括:
将所述第一日志特征向量输入第一特征推理模型,得到与所述第一日志特征向量匹配的第二根因特征向量;其中,所述第一特征推理模型用于推理得到与日志特征向量匹配的根因特征向量;
计算所述第一根因特征向量与所述第二根因特征向量之间的相似度;
根据所述相似度,确定所述匹配结果。
3.如权利要求1所述的方法,其特征在于,将所述第一日志特征向量和所述第一根因特征向量进行匹配,得到匹配结果,包括:
将所述第一根因特征向量输入第二特征推理模型,得到与所述第一根因特征向量匹配的第二日志特征向量;其中,所述第二特征推理模型用于推理得到与根因特征向量匹配的日志特征向量;
计算所述第一日志特征向量与所述第二日志特征向量之间的相似度;
根据所述相似度,确定所述匹配结果。
4.如权利要求1所述的方法,其特征在于,将所述第一日志特征向量和所述第一根因特征向量进行匹配,得到匹配结果,包括:
将所述第一日志特征向量和所述第一根因特征向量输入全连接神经网络模型,得到所述第一日志特征向量与所述第一根因特征向量之间的相关系数;所述相关系数用于表示所述第一日志特征向量与所述第一根因特征向量之间的相关程度;
根据所述相关系数,确定所述匹配结果。
5.如权利要求1-4任一项所述的方法,其特征在于,根据所述预测问题类别和所述实际问题类别,以及所述匹配结果,对所述特征提取模型的参数进行调整,包括:
根据所述预测问题类别和所述实际问题类别,计算第一误差;
根据所述匹配结果,计算第二误差;
根据所述第一误差和所述第二误差,对所述特征提取模型的参数进行调整。
6.一种问题根因预测方法,其特征在于,所述方法包括:
将待预测日志文本输入特征提取模型,得到待预测日志特征向量;
获取存储的多个历史特征向量样本,其中,每个历史特征向量样本中包含日志特征向量样本和根因特征向量样本;
根据所述待预测日志特征向量与每个历史特征向量样本中包含的日志特征向量样本和根因特征向量样本,计算所述待预测日志特征向量与每个历史特征向量样本之间的相关系数;所述待预测日志特征向量与每个历史特征向量样本之间的相关系数用于表示所述待预测日志特征向量与每个历史特征向量样本之间的相关程度;
在所述多个历史特征向量样本中,确定与所述待预测日志特征向量之间的相关系数最高目标历史特征向量样本;
确定所述目标历史特征向量样本对应的目标问题根因作为所述待预测日志文本的问题根因预测结果。
7.如权利要求6所述的方法,其特征在于,所述多个历史特征向量样本中每个历史特征向量样本中包含的日志特征向量样本和根因特征向量样本是通过所述特征提取模型得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911252002.9/1.html,转载请声明来源钻瓜专利网。