[发明专利]多任务预测模型的训练、事件类型的预测方法及装置有效
申请号: | 202010851731.2 | 申请日: | 2020-08-21 |
公开(公告)号: | CN111738534B | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 应缜哲;王维强;李志峰;孟昌华 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q30/02;G06K9/62 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 张明;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 任务 预测 模型 训练 事件 类型 方法 装置 | ||
本说明书实施例提供一种多任务预测模型的训练、事件类型的预测方法及装置,在训练方法中,获取初始样本集。对于任意的第一样本,在前i‑1棵决策树中,获取包括第一样本的各叶子节点各自的N个分数。基于各叶子节点各自的N个分数以及第一样本的N个标签值,确定若干梯度,并执行第一融合,得到第一样本的融合梯度。对于第i棵决策树的当前节点,获取分割到当前节点的样本集中各样本的融合梯度。基于当前样本集中各样本的融合梯度,从各样本特征以及当前样本集中各样本对应于各样本特征的特征值中,分别确定出当前节点的分裂特征和特征阈值。基于当前节点的分裂特征和特征阈值,对当前样本集进行分割,生成当前节点对应的子节点,直至到达叶子节点。
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种多任务预测模型的训练、事件类型的预测方法及装置。
背景技术
传统技术中,梯度提升决策树(Gradient boosted decision trees,GBDT)通常只能用于训练单任务预测模型。这里的单任务预测模型是指只能针对单任务进行预测。比如,单任务预测模型只能预测当前文本是否为广告,或者预测当前事件是否为欺诈事件等。
然而,在现实场景中,通常需要进行多任务预测。比如,为了实现对事件进行有效的风险管控,通常需要针对某个事件,预测其对应于各个欺诈类型的概率。基于此,就需要提供一种多任务预测模型的训练方法。
发明内容
本说明书一个或多个实施例描述了一种多任务预测模型的训练、事件类型的预测方法及装置,可以大大提升多任务预测模型的鲁棒性。
第一方面,提供了一种多任务预测模型的训练方法,包括:
获取初始样本集;所述初始样本集中的每个样本包括样本特征和对应于N个业务目标的N个标签值;
对于所述初始样本集中任意的第一样本,在前i-1棵决策树中,获取包括所述第一样本的各叶子节点各自的对应于所述N个业务目标的N个分数;i和N均为正整数;
基于所述各叶子节点各自的N个分数以及所述第一样本的N个标签值,确定所述第一样本的对应于所述N个业务目标的若干梯度;
对所述若干梯度执行第一融合,得到所述第一样本的融合梯度;
对于所述第i棵决策树的当前节点,获取分割到当前节点的当前样本集中各样本的融合梯度;
基于当前样本集中各样本的融合梯度,从各样本特征以及当前样本集中各样本对应于所述各样本特征的特征值中,分别确定出当前节点对应的分裂特征和特征阈值;
基于当前节点对应的分裂特征和特征阈值,对当前样本集进行分割,生成当前节点对应的子节点,直至到达叶子节点。
第二方面,提供了一种事件类型的预测方法,包括:
获取根据第一方面的方法训练的多任务预测模型,所述多任务业务预测模型包括多棵决策树;
获取第一事件的事件特征以及待预测欺诈类型;
将所述第一事件的事件特征分别输入所述多棵决策树,并从各棵决策树中获取包括所述第一事件的各叶子节点对应于所述待预测事件类型的第一欺诈概率;其中任意的第一叶子节点的第一欺诈概率为所述第一叶子节点的对应于N个欺诈类型的N个欺诈概率中的一个欺诈概率;
对所述各叶子节点对应于所述待预测欺诈类型的第一欺诈概率进行累加,得到目标概率;
基于所述目标概率,判断所述第一事件是否属于所述待预测欺诈类型。
第三方面,提供了一种多任务预测模型的训练装置,包括:
获取单元,用于获取初始样本集;所述初始样本集中的每个样本包括样本特征和对应于N个业务目标的N个标签值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010851731.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理