[发明专利]兼顾预测精度和隐私保护的预测模型训练方法及装置有效
申请号: | 202010759897.1 | 申请日: | 2020-07-31 |
公开(公告)号: | CN111738441B | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 王力;周俊 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06F21/62;G06F16/9535;G06Q30/06 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 兼顾 预测 精度 隐私 保护 模型 训练 方法 装置 | ||
1.一种兼顾预测精度和隐私保护的预测模型训练方法,通过服务器执行;所述预测模型包括特征提取层和预测层,所述预测模型用于针对输入对象的原始特征进行业务预测;对象包括用户、商品、事件中的一种;所述方法包括:
获取训练集中任意的第一样本,所述第一样本包括第一对象的第一原始特征和对应的第一标签;
从所述第一原始特征中提取所述第一对象在多个隐私属性方面的第一实际值;
将所述第一原始特征输入所述特征提取层,得到所述第一对象的第一提取特征;
将所述第一提取特征输入所述预测层,得到第一预测信息;基于所述第一预测信息与所述第一标签之间的差异,确定第一预测损失;
将所述第一提取特征输入预先训练的隐私保护模型,得到所述第一对象在多个隐私属性方面的第一预测值,基于所述第一预测值和所述第一实际值之间的差异,确定第二预测损失;
向减小所述第一预测损失、增大所述第二预测损失的方向,更新所述特征提取层。
2.根据权利要求1所述的方法,其中,所述隐私保护模型采用以下方式训练得到:
获取所述训练集中任意的第二样本,所述第二样本包括第二对象的第二原始特征;
从所述第二原始特征中提取所述第二对象在多个隐私属性方面的第二实际值;
将所述第二原始特征输入所述特征提取层,得到所述第二对象的第二提取特征;
将所述第二提取特征输入隐私保护模型,得到所述第二对象在多个隐私属性方面的第二预测值,基于所述第二预测值和所述第二实际值之间的差异,确定第三预测损失;
向减小所述第三预测损失的方向,更新所述隐私保护模型。
3.根据权利要求1所述的方法,所述隐私保护模型包括特征网络和激活层;所述将所述第一提取特征输入预先训练的隐私保护模型的步骤,包括:
将所述第一提取特征输入所述特征网络,得到转换特征,将所述转换特征输入所述激活层,得到所述第一对象在多个隐私属性方面的第一预测值。
4.根据权利要求1所述的方法,所述更新所述特征提取层的步骤,包括:
基于所述第一预测损失减去所述第二预测损失的差值或加权差值,构建合成预测损失,向减小所述合成预测损失的方向,更新所述特征提取层。
5.根据权利要求1所述的方法,所述基于所述第一预测值和所述第一实际值之间的差异,确定第二预测损失的步骤,包括:
基于多个隐私属性对应的第一预测值和第一实际值的差异,分别确定多个隐私属性对应的子预测损失;
基于多个子预测损失,确定所述第二预测损失。
6.根据权利要求5所述的方法,所述基于多个子预测损失,确定所述第二预测损失的步骤,包括:
基于多个子预测损失的和,确定所述第二预测损失。
7.根据权利要求5所述的方法,所述基于多个子预测损失,确定所述第二预测损失的步骤,包括:
将多个子预测损失中的最大值确定为所述第二预测损失。
8.根据权利要求1所述的方法,所述从所述第一原始特征中提取所述第一对象在多个隐私属性方面的第一实际值的步骤,包括:
将多个隐私属性与所述第一原始特征中的多个特征属性进行匹配,并基于匹配的特征属性的特征值确定对应的隐私属性的实际值,基于多个隐私属性的实际值确定所述第一实际值。
9.根据权利要求1所述的方法,所述第一原始特征包括以下特征组中的多个:对象的基本属性特征、对象的历史行为特征、对象的关联关系特征、对象的交互特征;当对象为用户时,所述特征组还包括用户身体指标特征。
10.根据权利要求9所述的方法,所述隐私保护模型包括递归神经网络;所述递归神经网络包括循环神经网络RNN或长短期记忆网络LSTM。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010759897.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:通过区块链进行权益累加的方法及装置
- 下一篇:业务模型的联合训练方法及装置