[发明专利]基于神经网络的联邦模型的训练方法、装置及计算机设备有效
申请号: | 202110453299.6 | 申请日: | 2021-04-26 |
公开(公告)号: | CN113159289B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 王健宗;李泽远 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06N3/0442 | 分类号: | G06N3/0442;G06N3/084;G06N20/20 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 涂年影 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 联邦 模型 训练 方法 装置 计算机 设备 | ||
1.一种基于神经网络的联邦模型的训练方法,其特征在于,包括以下步骤:
接收对预置的联邦模型进行迭代训练的训练请求;
根据所述训练请求获取所述联邦模型的每个参与方向所述联邦模型发送的历史梯度信息;
根据预置的LSTM模型对所述历史梯度信息进行筛选,得到当前时刻需对所述联邦模型进行迭代更新的多个参与方;
接收所述多个参与方中每个参与方的本地数据训练相应的本地模型后生成的梯度信息;
根据所述梯度信息对所述联邦模型进行迭代更新;
所述根据预置的LSTM模型对所述历史梯度信息进行筛选,得到当前时刻需对所述联邦模型进行迭代更新的多个参与方,包括:
将所述历史梯度信息输入至所述LSTM模型中,得到所述联邦模型的每个参与方的历史隐藏状态;
根据所述历史隐藏状态生成所述每个参与方的期望值;
根据∈-贪婪算法对所述期望值进行筛选,得到当前时刻需对所述联邦模型进行迭代更新的多个参与方;
所述历史梯度信息为对所述联邦模型的每个参与方在当前时刻之前向所述联邦模型发送的梯度信息;
所述期望值是通过将所述历史隐藏状态使用Sigmoid函数进行归一化处理,进而得到所述联邦模型的每个参与方在当前时刻之前的每一时刻参与对所述联邦模型进行迭代更新的概率,然后根据该概率以及所述联邦模型的每个参与方的历史梯度信息进行期望计算得到,具体的计算公式为:其中,为每个参与方当前时刻之前的每一时刻的梯度信息,Pt-1为每个参与方当前时刻之前的每一时刻参与对所述联邦模型进行迭代更新的概率,Qt为所述联邦模型中的每个参与方参与对所述联邦模型进行迭代更新的期望。
2.根据权利要求1所述的基于神经网络的联邦模型的训练方法,其特征在于,所述根据所述梯度信息对所述联邦模型进行迭代更新,包括:
根据预设的私钥对当前时刻所述多个参与方的梯度信息进行解密,得到解密后的每个参与方的梯度信息;
汇总所述解密后的每个参与方的梯度信息并根据汇总后的梯度信息对所述联邦模型进行迭代更新。
3.根据权利要求1所述的基于神经网络的联邦模型的训练方法,其特征在于,所述接收所述多个参与方中每个参与方的本地数据训练相应的本地模型后生成的梯度信息之前,还包括:
获取未经本地数据进行训练的本地模型并根据所述本地模型对所述联邦模型进行同步;
根据所述联邦模型的同步结果请求所述每个参与方训练相应的本地模型。
4.根据权利要求1所述的基于神经网络的联邦模型的训练方法,其特征在于,所述根据所述梯度信息对所述联邦模型进行迭代更新之后,还包括:
获取所述联邦模型更新后的精度并根据所述精度对所述LSTM模型进行更新。
5.根据权利要求4所述的基于神经网络的联邦模型的训练方法,其特征在于,所述获取所述联邦模型更新后的精度并根据所述精度对所述LSTM模型进行更新,包括:
基于预设的验证集对所述更新后的联邦模型进行精度计算,得到所述联邦模型更新后的精度;
根据所述更新后的精度对所述LSTM模型进行更新。
6.根据权利要求4所述的基于神经网络的联邦模型的训练方法,其特征在于,所述根据所述更新后的精度对所述LSTM模型进行更新,包括:
根据所述多个参与方的数量、所述联邦模型更新后的精度生成所述LSTM模型的奖励信号;
根据所述奖励信号构建更新所述LSTM模型的经验重放池并根据所述经验重放池对所述LSTM模型进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110453299.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于水泵叶轮成型的铸造模具
- 下一篇:一种有机硅离型剂抗起雾性能测试方法