[发明专利]神经网络模型的训练方法、装置、设备和存储介质有效
申请号: | 202111506310.7 | 申请日: | 2021-12-10 |
公开(公告)号: | CN114186669B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 荆博 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06N3/098 | 分类号: | G06N3/098;G06N3/084;G06N3/09;G06F21/62;G06F21/60;G06N3/04 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 侯军洋 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 模型 训练 方法 装置 设备 存储 介质 | ||
1.一种神经网络模型的训练方法,包括:
从至少两个特征提供方分别获取样本用户的特征表示密文;所述特征表示密文基于特征提供方中的特征子神经网络,根据样本用户在该特征提供方所关联的特征项上的特征数据确定;
确定样本用户的标签密文,并基于标签子神经网络,根据所述特征表示密文和所述标签密文,确定标签子神经网络中标签神经元的损失误差密文和梯度密文;
控制特征提供方对标签神经元的梯度密文进行解密得到解密结果,根据从特征提供方获取的解密结果更新标签神经元的网络参数;
将与特征子神经网络中特征神经元连接的标签神经元,作为特征子神经网络的关联神经元,向特征提供方发送关联神经元的损失误差密文,由特征提供方对关联神经元的损失误差密文进行解密得到损失误差原文,并根据关联神经元的损失误差原文更新特征神经元的网络参数;
待训练神经网络模型包括至少两个特征子神经网络和所述标签子神经网络;
其中,所述基于标签子神经网络,根据所述特征表示密文和所述标签密文,确定标签子神经网络中标签神经元的损失误差密文和梯度密文,包括:
基于标签子神经网络中的标签隐藏层和输出层,根据从至少两个特征提供方获取的样本用户的特征表示密文,通过正向传播得到标签神经元的激活值密文;
根据标签神经元的激活值密文和样本用户的标签密文,通过反向传播确定标签神经元的损失误差密文;
根据标签神经元的损失误差密文,确定标签神经元的梯度密文。
2.根据权利要求1所述的方法,其中,所述特征表示密文通过对样本用户的特征表示原文进行同态加密得到;所述特征表示原文为所述特征子神经网络对所述特征数据的输出结果;所述标签密文通过对样本用户的标签数据进行同态加密得到。
3.根据权利要求1所述的方法,其中,所述特征子神经网络包括特征输入层和至少一个特征隐藏层;所述标签子神经网络包括至少一个标签隐藏层和输出层;
所述方法还包括:
从至少两个特征提供方分别获取特征子神经网络的末尾特征隐藏层中特征神经元数量;
根据各特征神经元数量,确定首个标签隐藏层中标签神经元数量。
4.根据权利要求3所述的方法,其中,所述将与特征子神经网络中特征神经元连接的标签神经元,作为特征子神经网络的关联神经元,包括:
从首个标签隐藏层的标签神经元中,选择与特征子神经网络的末尾特征隐藏层中特征神经元所连接的标签神经元,作为特征子神经网络的关联神经元。
5.根据权利要求1所述的方法,所述方法还包括:
分别从至少两个特征提供方获取特征提供方所关联的候选用户标识;
对至少两个特征提供方所关联的候选用户标识求交集,得到公共用户标识;
向至少两个特征提供方发送所述公共用户标识,用于基于公共用户标识确定样本用户。
6.根据权利要求1所述的方法,其中,所述控制特征提供方对标签神经元的梯度密文进行解密得到解密结果,根据从特征提供方获取的解密结果更新标签神经元的网络参数,包括:
对标签神经元的梯度密文添加随机掩码,得到梯度掩码密文;
向任一特征提供方发送所述梯度掩码密文,由该特征提供方对所述梯度掩码密文进行解密,得到梯度掩码原文;
从该特征提供方获取所述梯度掩码原文,并对所述梯度掩码原文剔除随机掩码,得到标签神经元的梯度原文,且采用标签神经元的梯度原文更新标签神经元的网络参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111506310.7/1.html,转载请声明来源钻瓜专利网。