[发明专利]实现线上机器学习模型的更新迭代的方法和装置在审

专利信息
申请号: 201811619035.8 申请日: 2018-12-28
公开(公告)号: CN111382874A 公开(公告)日: 2020-07-07
发明(设计)人: 高晓伟 申请(专利权)人: 第四范式(北京)技术有限公司
主分类号: G06N20/00 分类号: G06N20/00
代理公司: 北京铭硕知识产权代理有限公司 11286 代理人: 曾世骁;尹淑梅
地址: 100085 北京市海淀区上*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 实现 线上 机器 学习 模型 更新 方法 装置
【说明书】:

公开了一种实现线上机器学习模型的更新迭代的方法和装置,所述方法包括:由至少一个串行工作的机器学习模型组成的模型组对业务样本进行预测;模型组中的包括排在最前的机器学习模型的一个或多个机器学习模型被设置为:允许预测值大于本模型的基准阈值的业务样本通过,拒绝预测值小于本模型的比基准阈值小的下探阈值的业务样本,允许预测值小于等于基准阈值且大于等于下探阈值的业务样本以本模型对应的概率通过;获取模型组允许通过的业务样本的业务反馈信息,根据业务反馈信息与相应的业务样本构成训练样本;基于排在最后的机器学习模型上线之后的预定时间内产生的训练样本来训练新的机器学习模型,将训练好的新的机器学习模型串接到模型组中。

技术领域

本公开总体说来涉及人工智能(AI)领域,更具体地,涉及一种实现线上机器学习模型的更新迭代的方法和装置。

背景技术

在机器学习领域,往往通过将经验数据提供给机器学习算法来训练机器学习模型以确定构成机器学习模型的理想参数,而训练好的机器学习模型可在各种业务领域被应用于在面对新的业务样本时提供相应的预测结果。机器学习模型的构建和应用不是一蹴而就的事情,随着时间的推移,模型需要不断使用新的数据来迭代和更新。一方面,随着时间的推移,会积累更丰富的数据,而且越新的数据越能反应最新的趋势和业务变化;另一方面,随着业务的开展,可能会有新的数据来源,供模型更好的刻画业务样本,这些都是触发模型升级迭代的内在原因。

在利用机器学习模型进行业务判断的场景,新积累的数据是由经过模型判断允许通过后的样本和该样本在实际业务中的表现信息所组成的。因此,如果用新积累的数据训练出的新模型直接替换旧模型,会由于新模型未“见”过“坏”的样本(旧模型判断拒绝通过的样本)而导致其业务判断的准确率下降,给实际业务带来风险。

发明内容

本公开的示例性实施例提供了一种实现线上机器学习模型的更新迭代的方法,所述方法包括:由至少一个串行工作的机器学习模型组成的模型组来对业务样本进行预测,其中,所述模型组中的包括排在最前的机器学习模型的一个或多个机器学习模型被设置为按以下方式工作:允许预测值大于本模型对应的基准阈值的业务样本通过,拒绝预测值小于本模型对应的比所述基准阈值小的下探阈值的业务样本,允许预测值小于等于所述基准阈值且大于等于所述下探阈值的业务样本以本模型对应的概率通过,并且其中,所述模型组中的其它机器学习模型被设置为按以下方式工作:允许预测值大于等于与本模型对应的基准阈值的业务样本通过,拒绝预测值小于所述基准阈值的业务样本;获取所述模型组允许通过的业务样本的业务反馈信息,根据业务反馈信息与相应的业务样本构成训练样本;基于在当前模型组中的排在最后的机器学习模型上线之后的预定时间内产生的训练样本来训练新的机器学习模型,并将训练好的新的机器学习模型串接在所述排在最后的机器学习模型之后以将所述新的机器学习模型上线;分别降低所述一个或多个机器学习模型中的每个机器学习模型的基准阈值和下探阈值,其中,降低后的下探阈值小于降低后的基准阈值;当模型组中的一个机器学习模型的基准阈值变更为小于等于预设预警阈值时,下线该机器学习模型。

根据本公开的示例性实施例,其中,所述基于在当前模型组中的排在最后的机器学习模型上线之后的预定时间内产生的训练样本来训练新的机器学习模型的步骤可以包括:遵循训练样本的分布与当前模型组中的排在最后的机器学习模型上线之后的业务样本分布保持一致的原则,获取训练样本;基于所获取的训练样本训练所述新的机器学习模型。

根据本公开的示例性实施例,其中,当所述一个或多个机器学习模型仅包括排在最前的机器学习模型时,遵循训练样本的分布与当前模型组中的排在最后的机器学习模型上线之后的业务样本分布保持一致的原则获取的训练样本可以满足下述公式:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811619035.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top