[发明专利]模型构建方法、装置、电子设备和存储介质在审
申请号: | 202111027468.6 | 申请日: | 2021-09-02 |
公开(公告)号: | CN113722759A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 吴博峰;周瀚池;吴翟宁;梁议丹 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/60 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘丹;黄健 |
地址: | 518027 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 构建 方法 装置 电子设备 存储 介质 | ||
本发明提供一种模型构建方法、装置、电子设备和存储介质。该模型构建方法可应用于纵向联邦学习的第一参与方,该方法可以包括:确定第一样本;所述第一样本中包括对齐的用户身份加密数据、标签加密数据和日期数据;根据所述第一样本,确定若干份第一回溯样本,同一用户身份加密数据在不同第一回溯样本中对应的日期数据不同;向第二参与方发送若干份所述第一回溯样本,以使所述第二参与方联合所述第一参与方,基于若干份所述第一回溯样本和所述第二参与方本地的对应日期的若干份第二回溯样本,进行建模,生成目标模型;所述第二回溯样本中包括对齐的用户身份加密数据和若干特征加密数据。
技术领域
本发明涉及数据处理领域,尤其涉及一种模型构建方法、装置、电子设备和存储介质。
背景技术
联邦学习(federated learning)是指通过联合不同的参与方(participant或party,也称为数据拥有者(data owner)或客户(client))进行机器学习的方法。在联邦学习中,各参与方并不需要向其它参与方和协调者(coordinator,也称为参数服务器(parameter server)或聚合服务器(aggregation server))暴露自己拥有的数据,因而可以很好地保护用户隐私和保障数据安全。
其中,纵向联邦学习是在各参与方的用户重叠较多,而数据特征重叠较少的情况下,取出各参与方之间相同用户对应的那部分数据进行联合机器学习训练。
在传统的纵向联邦学习过程中,采用的样本数据的时间维度单一,导致模型在上线后稳定性偏低,生命周期较短。
发明内容
本发明的主要目的在于提供一种模型构建方法、装置、电子设备和存储介质,旨在解决上述技术问题。
为实现上述目的,本发明提供一种模型构建方法,应用于纵向联邦学习的第一参与方,所述方法包括:
确定第一样本;所述第一样本中包括对齐的用户身份加密数据、标签加密数据和日期数据;
根据所述第一样本,确定若干份第一回溯样本,同一用户身份加密数据在不同第一回溯样本中对应的日期数据不同;
向第二参与方发送若干份所述第一回溯样本,以使所述第二参与方联合所述第一参与方,基于若干份所述第一回溯样本和所述第二参与方本地的对应日期的若干份第二回溯样本,进行建模,生成目标模型;所述第二回溯样本中包括对齐的用户身份加密数据和若干特征加密数据。
可选的,所述方法还包括:
确定第二参与方的数据的最早可回溯日期;
根据所述最早可回溯日期,确定时间因子;所述时间因子包括若干个单位时间;
所述根据所述第一样本,确定若干份第一回溯样本,同一用户身份加密数据在不同第一回溯样本中对应的日期数据不同,包括:
根据所述第一样本,结合所述时间因子,确定若干份第一回溯样本,同一用户身份加密数据在不同第一回溯样本中对应的日期数据不同。
可选的,所述时间因子为k,所述时间因子包括(k-1)个月,k为正整数;
所述根据所述第一样本,结合所述时间因子,确定若干份第一回溯样本,同一用户身份加密数据在不同第一回溯样本中对应的日期数据不同,包括:
根据所述第一样本中的日期数据,结合时间因子,确定第i个第一回溯样本中的日期数据为第一样本中的日期数据-(i-1),i为小于等于k的正整数。
可选的,所述向第二参与方发送若干份所述第一回溯样本,以使所述第二参与方联合所述第一参与方,基于若干份所述第一回溯样本和所述第二参与方本地的对应日期的若干份第二回溯样本,进行建模,生成目标模型,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111027468.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能控制下水器
- 下一篇:一种基于多视图的无人驾驶场景聚类方法及系统