[发明专利]一种模型训练方法、装置及电子设备在审
申请号: | 202210380734.1 | 申请日: | 2022-04-12 |
公开(公告)号: | CN114938337A | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 田光见;饶思维;叶强;段艳杰 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04L41/14 | 分类号: | H04L41/14;G06K9/62 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 郭建凯;陈霁 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 装置 电子设备 | ||
本申请提供了一种模型训练方法、装置及电子设备。该方法包括确定N种类型的样本数据,样本数据包括在通信网络中由网络设备产生的数据,N≥1;基于样本数据,对第一目标模型进行自监督训练,第一目标模型中包括第一子模型,第一子模型包括第一网络和第二网络,第一网络中包括N种第一子网络,每种第一子网络均用于对一种类型的样本数据进行特征提取,以得到N个第一特征,第二网络中包括N种第二子网络,每种第二子网络均用于基于N个第一特征对一种类型的样本数据进行预测。由此实现了对多种不同类型的现网数据进行统一建模,从而有效地建模不同数据之间的业务关联关系,降低了网络运维的难度。
技术领域
本申请涉及人工智能(artificial intelligence,AI)技术领域,尤其涉及一种模型训练方法、装置及电子设备。
背景技术
随着通信技术的发展,全球通信网络中的物理站点数、逻辑站点数和频谱等也逐渐增多,进而造成了大规模的异构网(比如:长期演进(long term evolution,LTE)、通用移动通信系统(universal mobile telecommunications system,UMTS)、无线局域网(wireless local area networks,WLAN)等)并存。在大规模的异构网并存时,网络环境会变的越来越复杂,使得网络运维的难度剧增。
发明内容
本申请提供了一种模型训练方法、装置、电子设备、计算机存储介质、计算机产品及芯片,能够实现对多种不同类型的现网数据进行统一建模,从而可以有效地建模不同数据之间的业务关联关系,降低了网络运维的难度。
第一方面,本申请提供一种模型训练方法,该方法可以包括:确定N种类型的样本数据,样本数据包括在通信网络中由网络设备产生的数据,N≥1;基于样本数据,对第一目标模型进行自监督训练,其中,第一目标模型中包括第一子模型,第一子模型包括第一网络和第二网络,第一网络中包括N种第一子网络,每种第一子网络均用于对一种类型的样本数据进行特征提取,以得到N个第一特征,第二网络中包括N种第二子网络,每种第二子网络均用于基于N个第一特征,对一种类型的样本数据进行预测。示例性的,样本数据可以为下文所描述的现网数据,第一子模型可以为下文所描述的子模型二。
这样,可以实现对多种不同类型的现网数据进行统一建模,从而可以有效地建模不同数据之间的业务关联关系,降低了网络运维的难度。同时,针对不同类型的样本数据设计不同类型的用于进行特征提取的网络和用于进行数据预测的网络,可以有效的针对不同类型的数据的特点进行建模,从而实现更好地建模不同数据的内在结构特点,提升模型预测的准确度。
在一种可能的实现方式中,N种类型的样本数据包括:离散Token序列数据、高维连续型时间序列数据和事件序列数据,第一网络为编码器,第二网络为解码器;离散Token序列数据对应的第一子网络为基于Transformer进行编码的网络,离散Token序列数据对应的第二子网络为基于Transformer进行解码的网络;高维连续型时间序列数据和事件序列数据对应的第一子网络均为基于循环神经网络RNN进行编码的网络,高维连续型时间序列数据和事件序列数据对应的第二子网络均为基于RNN进行解码的网络。
在一种可能的实现方式中,第一目标模型中还包括第二子模型,第二子模型基于与通信领域相关的知识训练得到,第二子模型用于生成N种类型的样本数据中蕴含的通信领域相关的知识的表示,以得到第二特征;其中,每种第二子网络均用于基于第二特征和N个第一特征,对一种类型的样本数据进行预测。这样通过第二子模型引入通信原理知识,解决了以往运维分析只针对单一数据进行建模无法反映业务事实的缺陷,从而解决了数据异常不等于业务异常的问题;同时,与规则引入通信原理知识的方法相比,也减少了人工总结规则的工作量,提高了技术方案的泛化能力与扩展性。示例性的,第二子模型可以为下文所描述的子模型一,通信领域相关的知识可以为下文所描述的通信原理知识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210380734.1/2.html,转载请声明来源钻瓜专利网。