[发明专利]用于构建风险控制模型的方法和系统有效
申请号: | 201910587071.9 | 申请日: | 2019-07-01 |
公开(公告)号: | CN110334814B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 金宏;王维强;赵闻飙 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06Q40/04 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新;朱文杰 |
地址: | 英属开曼群岛大开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 构建 风险 控制 模型 方法 系统 | ||
本公开提供了一种用于高效地构建风险控制模型的方法,包括:构建基础模型库以在触发新业务时选择基础模型库中的模型,来搭建缺省模型;通过自动特征生成、自动特征选择和自动调参来构建适合新业务的新模型;经由迁移学习训练缺省模型和新模型;自动融合经训练的缺省模型和经训练的新模型,以生成融合模型;将经训练的缺省模型用作线上模型,并将经训练的新模型和融合模型用作备份模型;以及当备份模型之一优于线上模型时,用该备份模型替代线上模型。
技术领域
本公开主要涉及风险控制,尤其涉及风险控制模型。
背景技术
互联网金融的风险控制涉及交易和资金风险防控,包括盗用、欺诈、营销作弊、垃圾注册识别和决策等。
以在超市收银台以手机APP进行支付的场景为例,风险控制系统需要检查手机账户是否被盗用、是否欺诈被骗、是否有违法套现等。在实践中,不同的风险类型会给模型的构建和更新带来不同的挑战。
当前,风险控制模型在开发和部署的过程中主要碰到两个比较大的问题。
一个问题是新建模型流程复杂,其中的数据清洗、模型训练、模型部署都需要耗费大量的人力,平均一个模型开发和部署耗时超过1个月。这导致针对新业务,模型响应速度比较慢。
另一个问题是模型迭代周期长,整个模型的更新需要耗费大量人力和时间来进行重训和部署。这导致风险对抗能力比较差,因为风险无时不在变化,有很强的对抗性。
本领域需要一种高效的用于构建风险控制模型的方法和系统,可针对新站点、新场景快速上线模型,从而为针对时刻变化的风险快速更新和迭代模型奠定基础。
发明内容
为解决上述技术问题,本公开提供了一种高效的用于构建风险控制模型的方案。
在本公开一实施例中,提供了一种用于高效地构建风险控制模型的方法,包括:构建基础模型库以在触发新业务时选择基础模型库中的模型,来搭建缺省模型;通过自动特征生成、自动特征选择和自动调参来构建适合新业务的新模型;经由迁移学习训练缺省模型和新模型;自动融合经训练的缺省模型和经训练的新模型,以生成融合模型;将经训练的缺省模型用作线上模型,并将经训练的新模型和融合模型用作备份模型;以及当备份模型之一优于线上模型时,用该备份模型替代线上模型。
在本公开的另一实施例中,搭建缺省模型进一步包括:针对各个场景提炼风险模块;针对每个风险模块构建基础模型,并基于基础模型构建基础模型库;在触发新业务时,选取基础模型库中的对应基础模型;以及使用对应基础模型搭建出适合新业务的缺省模型。
在本公开的又一实施例中,所提炼的风险模块包括主动方、被动方、设备、环境、行为、关系、冲突、突变和FTG(Fraud to Gross)。
在本公开的另一实施例中,构建新模型进一步包括:获取原有变量池;基于原有变量池中的原有变量自动生成不同类型的特征;从原有变量池和自动生成的特征中选择适合场景的变量,以生成变量列表;针对变量列表进行自动调参;以及获取适合场景的新模型。
在本公开的又一实施例中,自动特征生成包括对原有的特征进行转换、计算以及聚合而产生新的候选特征。
在本公开的另一实施例中,自动特征选择涉及特征子集搜索和特征子集评价。
在本公开的又一实施例中,自动调参采用网格搜索、随机搜索以及贝叶斯优化之一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910587071.9/2.html,转载请声明来源钻瓜专利网。