[发明专利]传染病概率预测模型的联邦学习方法、装置及相关设备有效
申请号: | 202110801132.4 | 申请日: | 2021-07-15 |
公开(公告)号: | CN113345597B | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 刘广 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G16H50/80 | 分类号: | G16H50/80;G06N20/20 |
代理公司: | 深圳国新南方知识产权代理有限公司 44374 | 代理人: | 代文成 |
地址: | 518000 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 传染病 概率 预测 模型 联邦 学习方法 装置 相关 设备 | ||
1.一种传染病概率预测模型的联邦学习方法,其特征在于,所述方法包括:
获取存储在当前移动终端的用户数据,根据所述用户数据得到本端用户特征,所述用户数据包括用户的职业;
从中心服务器获取携带有在先梯度和损失的在先梯度损失表;
将所述本端用户特征作为训练样本,结合所述在先梯度和损失对传染病概率预测模型进行训练,获取训练后的当前梯度和损失;
通过所述中心服务器下发的公钥对所述当前梯度和损失进行加密,得到当前移动终端的加密梯度和损失;
接收在先移动终端发送的在先梯度损失表,判断所述在先梯度损失表是否包括掩码区域,所述在先梯度损失表记载了包括所述在先移动终端的梯度损失在内的历史用户的加密梯度损失;
当所述在先梯度损失表不包括所述掩码区域时,将所述在先梯度损失表发送至所述中心服务器,供所述中心服务器根据与各历史用户对应预设的私钥对对应掩码区域的加密梯度和损失进行解密,并对解密得到的各梯度和损失进行求和,得到所述携带有在先梯度和损失的在先梯度损失表;
当所述在先梯度损失表不包括所述掩码区域时,创建梯度损失表,将所述当前移动终端的加密梯度和损失保存在创建的梯度损失表中,对创建的梯度损失表中空白区域添加掩码,得到包括有所述掩码区域的更新的在先梯度损失表;
当所述在先梯度损失表包括有掩码区域时,将所述当前移动终端的加密梯度和损失保存在所述掩码区域,得到更新的在先梯度损失表;
将所述更新的在先梯度损失表发送至在后移动终端,将所述在后移动终端作为所述当前移动终端,循环所述判断所述在先梯度损失表是否包括掩码区域至所述结合所述在先梯度和损失对传染病概率预测模型进行训练的步骤,直到所述传染病概率预测模型的损失函数收敛。
2.根据权利要求1所述的传染病概率预测模型的联邦学习方法,其特征在于,所述根据所述用户数据得到本端用户特征的步骤包括:
根据所述当前移动终端的用户数据得到与每个所述用户数据相对应的用户特征;
计算每个所述用户特征的方差膨胀系数;
当计算的所述方差膨胀系数大于预设值时,将对应的用户特征从所述本端用户特征中移除。
3.根据权利要求1所述的传染病概率预测模型的联邦学习方法,其特征在于,所述根据所述用户数据得到本端用户特征的步骤包括:
对所述用户数据进行分箱;
根据每箱中包括的风险特征和非风险特征的占比计算各箱的权重;
根据计算得到的各箱的权重计算各箱对应类别的用户数据的信息值;
当所述信息值小于预设值时,将对应类别的用户数据移除。
4.根据权利要求3所述的传染病概率预测模型的联邦学习方法,其特征在于,通过以下公式计算各箱的权重:
其中,i表示箱数,pgood表示所述非风险特征的占比,pbad表示风险特征的占比;
通过以下公式计算各箱对应类别的用户数据的信息值:
IV=∑iIVi=∑i(pgood-pbad)WOEi
其中,IV表示所述信息值,i表示箱数,pgood表示所述非风险特征的占比,pbad表示风险特征的占比。
5.根据权利要求3所述的传染病概率预测模型的联邦学习方法,其特征在于,当所述用户数据为字符型数据时,所述对所述用户数据进行分箱的步骤包括:
判断所述字符型数据所属的类别;
根据所述类别对所述用户数据进行分箱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110801132.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电子烟
- 下一篇:基于图低秩稀疏分解的极化SAR图像特征挖掘方法