[发明专利]业务模型训练方法、装置、系统及电子设备有效
申请号: | 202010228702.0 | 申请日: | 2020-03-27 |
公开(公告)号: | CN111415015B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 邱伟峰 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06N20/10 | 分类号: | G06N20/10;G06K9/62;G06F21/62 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 郭思晨 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 业务 模型 训练 方法 装置 系统 电子设备 | ||
本说明书提出业务模型的训练方法、装置、系统及电子设备,数据提供方和数据使用方各自迭代各自模型单元的模型参数,双方模型单元的模型参数共同构成了业务模型的模型参数。在迭代后,数据提供方可将第一样本数据输入至第一模型单元,得到中间结果,并将中间结果发送给数据使用方。数据使用方可将中间结果和第二样本数据输入至第二模型单元,并基于第二模型单元输出的预测结果和标签确定是否接受本次迭代的模型参数,若接受,则双发各自进行下次模型参数的迭代更新。若不接受,则双方回退至上次迭代的模型参数,继续下次模型参数的迭代更新,直至业务模型收敛,从而实现防止个人数据泄露的情况下,丰富数据使用方的数据的特征维度。
技术领域
本说明书一个或多个实施例涉及人工智能领域,尤其涉及业务模型训练方法、装置、系统及电子设备。
背景技术
模型训练是人工智能技术中的重要组成部分。模型训练通常依赖用户的样本数据。通常情况下,用户的样本数据越多,特征维度越丰富,训练出的模型的精准性越高。
在一些场景中,业务方并没有大量的维度丰富的用户样本数据,为此,业务方需要向提供数据服务的第三方获取用户样本数据,通过第三方的用户样本数据来丰富特征维度,从而训练出更好的业务模型。这里将业务方称之为数据使用方,将提供数据服务的第三方称之为数据提供方。
由于用户样本数据是用户的隐私数据,数据提供方通常不允许将用户样本数据提供给数据使用方。而且,即使条件允许,作为重要的资产,数据提供方也不愿意将数据直接输出。因此,如何在不泄露用户隐私的情况下,丰富数据使用方的特征维度就成为业界持续探讨的问题。
发明内容
第一方面,本说明书提供一种业务模型的训练方法,所述业务模型包括第一模型单元和第二模型单元,所述第一模型单元配置在数据提供方,所述第二模型单元配置在数据使用方,所述数据提供方持有样本对象的第一样本数据,所述数据使用方持有所述样本对象的第二样本数据和所述样本对象的标签,所述第一样本数据和所述第二样本数据的特征维度不完全相同,所述方法应用在数据提供方,包括:
基于所述第一模型单元上次迭代时的模型参数MT-1,生成本次迭代的模型参数MT;
将所述第一样本数据输入模型参数为MT的第一模型单元,得到中间结果,并将该中间结果发送给所述数据使用方;
接收数据使用方返回的参数更新决策,所述参数更新决策由所述数据使用方将所述中间结果和所述第二样本数据输入模型参数为NT的第二模型单元后,基于该第二模型单元输出的预测结果和所述样本对象的标签确定;所述NT为所述第二模型单元本次迭代的模型参数;
当所述参数更新决策是接受本次迭代的模型参数时,检测所述业务模型是否收敛;
若否,则基于所述第一模型单元本次迭代时的模型参数MT,执行生成下次迭代的模型参数MT+1的步骤;
若是,则停止所述第一模型单元的模型参数的迭代,并确定所述业务模型训练完成。
第二方面,本说明书提供一种业务模型的训练方法,所述业务模型包括第一模型单元和第二模型单元,所述第一模型单元配置在数据提供方,所述第二模型单元配置在数据使用方,所述数据提供方持有样本对象的第一样本数据,所述数据使用方持有所述样本对象的第二样本数据和所述样本对象的标签,所述第一样本数据和所述第二样本数据的特征维度不完全相同,所述方法应用在数据使用方,包括:
基于所述第二模型单元上次迭代时的模型参数NT-1,生成本次迭代的模型参数NT;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010228702.0/2.html,转载请声明来源钻瓜专利网。