[发明专利]网络模型的训练方法、信息推送方法及相关装置有效
申请号: | 202011105734.8 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112434213B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 杨敏;原发杰;刘夺;李成明;姜青山 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/044;G06N3/0464;G06N3/08 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 黎坚怡 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 模型 训练 方法 信息 推送 相关 装置 | ||
1.一种网络模型的训练方法,其特征在于,所述方法包括:
采用第一训练数据对网络模型进行训练,得到第一输出信息;
对所述第一训练数据添加随机噪声,得到第二训练数据,采用所述第二训练数据对所述网络模型进行训练,得到第二输出信息;
确定所述第一输出信息的第一分布以及所述第二输出信息的第二分布;
计算所述第一分布与所述第二分布的相似度,得到第一相似度;
利用所述第一相似度进行梯度更新计算,以得到第一扰动值;其中,在利用所述第一相似度进行梯度更新计算时,所述网络模型的网络参数不进行更新;
对所述第一扰动值进行求导得到第二扰动值,并利用第一控制数值对所述第二扰动值进行加权,得到第三扰动值;
将所述第三扰动值确定为扰动信息;
对所述第一训练数据或所述第二训练数据添加所述扰动信息,得到第三训练数据,采用所述第三训练数据对所述网络模型进行训练,得到第三输出信息;
根据所述第三输出信息与预设输出信息之间的差异,调整所述网络模型的参数。
2.根据权利要求1所述的方法,其特征在于,
所述采用第一训练数据对网络模型进行训练,得到第一输出信息,包括:
从训练数据集中获取预设数量的目标训练数据作为第一训练数据;
将预设数量的所述目标训练数据进行序列化处理,以形成第一向量矩阵;
采用所述第一向量矩阵对所述网络模型进行训练,得到第一输出信息;其中,输出信息为概率矩阵,所述概率矩阵用于表示所述网络模型基于所述目标训练数据的预测信息。
3.根据权利要求2所述的方法,其特征在于,
所述对所述第一训练数据添加随机噪声,得到第二训练数据,采用所述第二训练数据对所述网络模型进行训练,得到第二输出信息,包括:
对所述第一向量矩阵中的每个元素添加随机噪声,得到第二向量矩阵,将所述第二向量矩阵作为第二训练数据;
采用所述第二向量矩阵对所述网络模型进行训练,得到第二输出信息;其中,输出信息为概率矩阵,所述概率矩阵用于表示所述网络模型基于所述第二向量矩阵的预测信息。
4.根据权利要求3所述的方法,其特征在于,
所述对所述第一训练数据或所述第二训练数据添加所述扰动信息,得到第三训练数据,采用所述第三训练数据对所述网络模型进行训练,得到第三输出信息,包括:
对所述第一向量矩阵或所述第二向量矩阵添加所述扰动信息,得到第三向量矩阵,将所述第三向量矩阵作为第三训练数据;
采用所述第三向量矩阵对所述网络模型进行训练,得到第三输出信息;其中,输出信息为概率矩阵,所述概率矩阵用于表示所述网络模型基于所述第三向量矩阵的预测信息。
5.根据权利要求4所述的方法,其特征在于,
所述对所述第一向量矩阵或所述第二向量矩阵添加所述扰动信息,得到第三向量矩阵,将所述第三向量矩阵作为第三训练数据,包括:
对所述第一向量矩阵或所述第二向量矩阵添加所述扰动信息,得到第三向量矩阵;
若所述第三向量矩阵与所述第一向量矩阵或所述第二向量矩阵的相似度满足约束条件,则确定所述第三向量矩阵为所述第三训练数据。
6.根据权利要求1所述的方法,其特征在于,
所述根据所述第三输出信息与预设输出信息之间的差异,调整所述网络模型的参数,包括:
利用第一输出信息与预设输出信息之间的差异,得到第一损失值,并利用第二控制数值对所述第一损失值进行加权,得到第二损失值;
利用第三输出信息与预设输出信息之间的差异,得到第三损失值,并利用第三控制数值对所述第二损失值进行加权,得到第四损失值;
利用所述第二损失值和所述第四损失值,调整所述网络模型的网络参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011105734.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种膜过滤模拟装置及其控制系统
- 下一篇:一种金属加工用冷镦装置