[发明专利]网络模型的训练方法、信息推送方法及相关装置有效
申请号: | 202011105734.8 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112434213B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 杨敏;原发杰;刘夺;李成明;姜青山 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/044;G06N3/0464;G06N3/08 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 黎坚怡 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 模型 训练 方法 信息 推送 相关 装置 | ||
本申请涉及计算机领域,公开了网络模型的训练方法、信息推送方法及相关装置。该训练方法包括:采用第一训练数据对网络模型进行训练,得到第一输出信息;对第一训练数据添加随机噪声,得到第二训练数据,采用第二训练数据对网络模型进行训练,得到第二输出信息;根据第一输出信息和第二输出信息,确定扰动信息;对第一训练数据或第二训练数据添加扰动信息,得到第三训练数据,采用第三训练数据对网络模型进行训练,得到第三输出信息;根据第三输出信息与预设输出信息之间的差异,调整网络模型的参数。通过上述方式,能够提升网络模型的鲁棒性和预测的准确性。
技术领域
本申请涉及计算机技术领域,特别是涉及一种网络模型的训练方法、信息推送方法及相关装置。
背景技术
近年来,随着计算机领域的快速发展,信息的爆炸式增长所产生的海量信息数据如何有效利用成为研究热点。相关机构预测,全球数据圈将从2018年的33ZB增至2025年的175ZB。要从海量的数据中获取到需求的信息就需要借助一定的搜索和推荐算法来帮助解决。目前众多的推荐算法被学术界和工业界研究和使用,并取得了很好的效果。
目前提出的训练方法解决了传统网络模型的一些缺点,但是这些网络模型在取得高性能的同时,一些问题也随之到来。例如:在电商场景下,如果恶意用户成功攻击推荐系统来达到一些目的,并且使得下一个item的推荐都是这个恶意用户指定的item,网络模型的鲁棒性问题将会造成严重损失。在新闻推荐领域,如果推荐系统遭到恶意攻击,使得线上的新闻推荐系统给用户推荐攻击者所展示的内容,或者和正常用户不相关的内容,就会严重影响推荐的可靠性,造成巨大的损失。
发明内容
本申请主要解决的技术问题是提供网络模型的训练方法、信息推送方法及相关装置,能够提升网络模型的鲁棒性和预测的准确性。
本申请采用的一种技术方案是提供一种网络模型的训练方法,该方法包括:采用第一训练数据对网络模型进行训练,得到第一输出信息;对第一训练数据添加随机噪声,得到第二训练数据,采用第二训练数据对网络模型进行训练,得到第二输出信息;根据第一输出信息和第二输出信息,确定扰动信息;对第一训练数据或第二训练数据添加扰动信息,得到第三训练数据,采用第三训练数据对网络模型进行训练,得到第三输出信息;根据第三输出信息与预设输出信息之间的差异,调整网络模型的参数。
其中,采用第一训练数据对网络模型进行训练,得到第一输出信息,包括:从训练数据集中获取预设数量的目标训练数据作为第一训练数据;将预设数量的目标训练数据进行序列化处理,以形成第一向量矩阵;采用第一向量矩阵对网络模型进行训练,得到第一输出信息;其中,输出信息为概率矩阵,概率矩阵用于表示网络模型基于目标训练数据的预测信息。
其中,对第一训练数据添加随机噪声,得到第二训练数据,采用第二训练数据对网络模型进行训练,得到第二输出信息,包括:对第一向量矩阵中的每个元素添加随机噪声,得到第二向量矩阵,将第二向量矩阵作为第二训练数据;采用第二向量矩阵对网络模型进行训练,得到第二输出信息;其中,输出信息为概率矩阵,概率矩阵用于表示网络模型基于第二向量矩阵的预测信息。
其中,对第一训练数据或第二训练数据添加扰动信息,得到第三训练数据,采用第三训练数据对网络模型进行训练,得到第三输出信息,包括:对第一向量矩阵或第二向量矩阵添加扰动信息,得到第三向量矩阵,将第三向量矩阵作为第三训练数据;采用第三向量矩阵对网络模型进行训练,得到第三输出信息;其中,输出信息为概率矩阵,概率矩阵用于表示网络模型基于第三向量矩阵的预测信息。
其中,对第一向量矩阵或第二向量矩阵添加扰动信息,得到第三向量矩阵,将第三向量矩阵作为第三训练数据,包括:对第一向量矩阵或第二向量矩阵添加扰动信息,得到第三向量矩阵;若第三向量矩阵与第一向量矩阵或第二向量矩阵的相似度满足约束条件,则确定第三向量矩阵为第三训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011105734.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种膜过滤模拟装置及其控制系统
- 下一篇:一种金属加工用冷镦装置