[发明专利]一种基于可信执行环境的模型训练方法、系统及装置在审
申请号: | 202011380981.9 | 申请日: | 2020-11-30 |
公开(公告)号: | CN112417485A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 嵇方方;王维强;陆毅成 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06K9/62;G06Q40/02 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 周嗣勇 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 可信 执行 环境 模型 训练 方法 系统 装置 | ||
本说明书公开了一种基于可信执行环境的模型训练方法、系统及装置。所述方法包括模型需求方将第一训练样本集发送到模型训练方的可信执行环境中;模型提供方将旧模型和第二训练样本集发送到模型训练方的可信执行环境中;所述旧模型是模型提供方预先基于第二训练样本集训练得到的;模型训练方在可信执行环境中基于所述旧模型构建新模型;所述新模型的输出包括针对输入样本的标签预测值和来源预测值;模型训练方在可信执行环境中,基于预设算法利用第一训练样本集和第二训练样本集训练所述新模型,所述预设算法用于降低所述新模型针对样本标签的损失、并增大所述新模型针对样本来源的损失。
技术领域
本说明书实施例涉及模型训练领域,尤其涉及一种基于可信执行环境的模型训练方法、系统及装置。
背景技术
目前,在训练模型时,通常需要事先积累大量样本进行训练。但由于新场景中难以积累足够的样本,导致训练得到的模型预测准确率较低。
为了解决这一问题,理论上可以从积累有足够多的样本的其他场景中,获取样本,用于新场景的模型训练,得到适应新场景的模型,提高模型预测准确率。但在实际应用中,考虑到数据安全和隐私保护的问题,往往难以直接从其他场景中获取样本。
以金融机构风控场景为例:新成立的某银行在训练风控模型时,由于银行是新成立的,暂时缺少实际风险事故的积累,也就没有足够的黑样本,训练得到的风控模型的预测准确率较低。尽管理论上该银行可以从其他银行中获取足够的黑样本用于风控模型训练,但其他银行往往出于数据安全和用户隐私保护的考虑,并不会将样本与该银行共享。
因此,目前亟需一种既能提高模型预测准确率,又能保护数据安全和隐私的方法。
发明内容
为了解决上述问题,本说明书提供了一种基于可信执行环境的模型训练方法、系统及装置。技术方案如下所示。
一种基于可信执行环境的模型训练方法,应用于包含模型需求方、模型提供方和模型训练方的系统;所述方法包括:
模型需求方将第一训练样本集发送到模型训练方的可信执行环境中;
模型提供方将旧模型和第二训练样本集发送到模型训练方的可信执行环境中;所述旧模型是模型提供方预先基于第二训练样本集训练得到的;
模型训练方在可信执行环境中基于所述旧模型构建新模型;所述新模型的输出包括针对输入样本的标签预测值和来源预测值;
模型训练方在可信执行环境中,基于预设算法利用第一训练样本集和第二训练样本集训练所述新模型,所述预设算法用于降低所述新模型针对样本标签的损失、并增大所述新模型针对样本来源的损失。
一种基于可信执行环境的模型训练系统,包含模型需求方、模型提供方和模型训练方;
模型需求方:用于将第一训练样本集发送到模型训练方的可信执行环境中;
模型提供方:用于将旧模型和第二训练样本集发送到模型训练方的可信执行环境中;所述旧模型是模型提供方预先基于第二训练样本集训练得到的;
模型训练方:用于在可信执行环境中基于所述旧模型构建新模型;所述新模型的输出包括针对输入样本的标签预测值和来源预测值;在可信执行环境中,基于预设算法利用第一训练样本集和第二训练样本集训练所述新模型,所述预设算法用于降低所述新模型针对样本标签的损失、并增大所述新模型针对样本来源的损失。
一种基于可信执行环境的模型训练装置,应用于模型训练方;所述装置包括:
第一接收单元:用于在可信执行环境中接收模型需求方发送的第一训练样本集、以及模型提供方发送的旧模型和第二训练样本集;所述旧模型是模型提供方预先基于第二训练样本集训练得到的;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011380981.9/2.html,转载请声明来源钻瓜专利网。