[发明专利]风控模型训练方法和装置在审
申请号: | 201610317630.0 | 申请日: | 2016-05-12 |
公开(公告)号: | CN107368936A | 公开(公告)日: | 2017-11-21 |
发明(设计)人: | 夏威;杨维嘉 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06 |
代理公司: | 北京国昊天诚知识产权代理有限公司11315 | 代理人: | 黄熊 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 | ||
1.一种风控模型训练方法,其特征在于,包括:
获取已知结果的历史数据;
将所述历史数据划分为第一数据集合和第二数据集合;
确定不同的损失函数;
针对每个不同的损失函数,根据该损失函数、所述第一数据集合中的历史数据及其已知结果来训练风控模型,使根据训练得到的风控模型和该损失函数对所述第一数据集合中的历史数据计算的损失值最小;
根据所述第二数据集合中的历史数据,分别验证针对不同的损失函数训练得到的各风控模型;
根据验证结果,在各风控模型中确定出最优模型;
当接收到待处理数据时,根据所述最优模型对所述待处理数据进行风控处理。
2.如权利要求1所述的方法,其特征在于,将所述历史数据划分为第一数据集合和第二数据集合,具体包括:
根据各历史数据的记录时间,将所述历史数据划分为第一数据集合和第二数据集合,其中,所述第二数据集合中的历史数据的记录时间均晚于第一数据集合中的历史数据的记录时间。
3.如权利要求1所述的方法,其特征在于,要训练的风控模型输出的风控结果为若干个风险等级;所述损失函数为:fi为第i个风险等级的历史数据的损失量,ai为第i个风险等级的权重。
4.如权利要求3所述的方法,其特征在于,确定不同的损失函数,具体包括:
通过调整各风险等级对应的权重,以确定不同的损失函数。
5.如权利要求4所述的方法,其特征在于,调整各风险等级对应的权重,具体包括:
采用坐标梯度下降法、网格搜索法中的至少一种,调整各风险等级对应的权重。
6.如权利要求1~5任一所述的方法,其特征在于,训练风控模型,具体包括:
采用随机森林算法、神经网络算法中的至少一种,训练风控模型。
7.如权利要求1或2所述的方法,其特征在于,根据所述第二数据集合中的历史数据,分别验证针对不同的损失函数训练得到的各风控模型,具体包括:
针对训练得到的每个风控模型,采用该风控模型对所述第二数据集合中的历史数据进行风控处理,根据该风控模型输出的结果以及该第二数据集合中的历史数据对应的已知结果,确定采用该风控模型对所述第二数据集合中的历史数据进行风控处理时所产生的实际损失值,将该实际损失值作为该风控模型的验证结果。
8.如权利要求7所述的方法,其特征在于,根据验证结果,在各风控模型中确定出最优模型,具体包括:
根据针对每个风控模型确定的实际损失值,将实际损失值最小的风控模型确定为最优模型。
9.如权利要求1所述的方法,其特征在于,所述历史数据包括:交易数据;
所述待处理数据包括:交易数据;
所述交易数据中包括:交易双方的身份数据、交易环境数据以及待交易对象数据中的至少一种。
10.一种风控模型训练装置,其特征在于,包括:
数据获取模块,用于获取已知结果的历史数据;
数据划分模块,用于将所述历史数据划分为第一数据集合和第二数据集合;
函数确定模块,用于确定不同的损失函数;
模型训练模块,用于针对每个不同的损失函数,根据该损失函数、所述第一数据集合中的历史数据及其已知结果来训练风控模型,使根据训练得到的风控模型和该损失函数对所述第一数据集合中的历史数据计算的损失值最小;
模型验证模块,用于根据所述第二数据集合中的历史数据,分别验证针对不同的损失函数训练得到的各风控模型;
模型确定模块,用于根据验证结果,在各风控模型中确定出最优模型;
数据处理模块,用于当接收到待处理数据时,根据所述最优模型对所述待处理数据进行风控处理。
11.如权利要求10所述的装置,其特征在于,所述数据划分模块,具体用于:
根据各历史数据的记录时间,将所述历史数据划分为第一数据集合和第二数据集合,其中,所述第二数据集合中的历史数据的记录时间均晚于第一数据集合中的历史数据的记录时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610317630.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理