[发明专利]保护数据隐私的多方联合训练对象推荐模型的方法及装置有效
申请号: | 202010384206.4 | 申请日: | 2020-05-09 |
公开(公告)号: | CN111291417B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 陈超超;曹绍升;王力;周俊 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/9535 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈婧玥;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 保护 数据 隐私 多方 联合 训练 对象 推荐 模型 方法 装置 | ||
本说明书实施例提供一种保护数据隐私的多方联合训练对象推荐模型的方法,其中多方为N方,共同维护M个用户对P个对象的总评分矩阵。该方法由N方中任意的第k方执行,包括:先通过秘密分享,获取以下矩阵分片:该总评分矩阵的第k评分矩阵分片、初始化的该P个对象的对象特征矩阵的第k对象矩阵分片和初始化的该M个用户的用户特征矩阵的第k用户矩阵分片;再执行多次迭代更新,具体地,基于上述矩阵分片,通过与其他N‑1方进行秘密分享矩阵运算,得到对象更新梯度和用户更新梯度的第k分片,进而更新第k对象矩阵分片和第k用户矩阵分片。如此在多次迭代更新结束后,N方各自交换更新后的矩阵分片,进行矩阵重构,进而建立各自的对象推荐模型。
技术领域
本说明书一个或多个实施例涉及信息安全技术领域,尤其涉及一种保护数据隐私的多方联合训练对象推荐模型的方法及装置。
背景技术
目前在推荐系统中,通常由单个数据方利用其存储的多个用户对多个对象的打分数据,学习用户特征向量和对象特征向量的潜在偏好,进而利用学习好的用户和对象的特征向量,去预测其中某个用户对某些对象的打分,其中某些对象通常是该某个用户未做出过打分行为的对象,进而根据预测分数向某个用户进行对象推荐。
随着多方利用各自持有的数据协同进行机器学习引发研究热潮,存储有不同打分数据的不同数据方,希望利用各自持有的打分数据协同学习用户特征向量和对象特征向量,以提高学习到的特征向量的准确度,进而提高预测打分的准确度和有效性。其中的难点在于,在学习过程中如何保证各方数据,包括用户数据、对象数据和打分数据等的隐私安全。
因此,需要一种方案,使得多方可以在保护数据隐私的前提下,联合学习特征向量,用于构建各自的对象推荐模型。然而,目前尚不存在相关方案。
发明内容
本说明书一个或多个实施例描述了一种保护数据隐私的多方联合训练对象推荐模型的方法,可以在保障各方数据隐私安全的同时,实现多方协同更新用户特征向量和对象特征向量,从而构建各自的对象推荐模型,进而做出更加精准的对象推荐。
根据第一方面,提供一种保护数据隐私的多方联合训练对象推荐模型的方法,所述多方为N方,所述N方共同维护M个用户对P个对象的总评分矩阵,该方法通过N方中任意的第k方执行,包括:通过秘密分享获取所述总评分矩阵的第k评分矩阵分片。通过秘密分享,获取初始化的所述P个对象的对象特征矩阵的第k对象矩阵分片,以及获取初始化的所述M个用户的用户特征矩阵的第k用户矩阵分片。执行多次迭代更新,其中任一次迭代更新包括:对于任意的第一用户和第一对象,从所述第k评分矩阵分片中获取第一用户对第一对象的第k评分分片;从上次迭代的第k对象矩阵分片中获取第一对象的第k对象特征分片;以及从上次迭代的第k用户矩阵分片中获取第一用户的第k用户特征分片;基于所述第k用户特征分片和第k对象特征分片,通过与其他N-1方进行秘密分享矩阵运算,得到所述第一用户和第一对象的特征向量相似度的第k相似度分片,将第k相似度分片和第k评分分片之差作为第k误差分片;基于所述第k误差分片和第k对象特征分片,通过与其他N-1方进行秘密分享矩阵运算,计算用户特征更新梯度,得到第k用户梯度分片;基于所述第k误差分片和第k用户特征分片,通过与其他N-1方进行秘密分享矩阵运算,计算对象特征更新梯度,得到第k对象梯度分片;根据所述第k用户梯度分片,更新所述第k用户特征分片;根据所述第k对象梯度分片,更新所述第k对象特征分片。
在一个实施例中,所述第k方具有所述总评分矩阵的第k评分子矩阵;所述通过秘密分享获取所述总评分矩阵的第k评分矩阵分片,包括:将所述第k评分子矩阵拆分为N个分片,保留其中的第k分片,将其他N-1个分片对应发送给其他N-1方;并且,从其他N-1方接收其他评分子矩阵的第k分片;将所述第k评分子矩阵的第k分片,和其他评分子矩阵的第k分片拼接,形成所述第k评分矩阵分片。
在一个实施例中,所述第k方具有所述总评分矩阵的第k评分子矩阵,所述第k评分子矩阵由M个用户对第k方中的Pk个对象的评分构成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010384206.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置