[发明专利]无监督风险防控模型的训练方法、更新方法及装置在审
申请号: | 201910058892.3 | 申请日: | 2019-01-22 |
公开(公告)号: | CN110009359A | 公开(公告)日: | 2019-07-12 |
发明(设计)人: | 陆毅成 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06Q20/40 | 分类号: | G06Q20/40;G06K9/62 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新;朱文杰 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标业务 在线系统 业务数据 无监督 重采样 采样 预设时间间隔 过滤操作 增量训练 更新 替换 可信 孤立 森林 申请 | ||
本申请实施例公开了一种无监督风险防控模型的训练方法、更新方法及装置,该方法包括:基于预设时间间隔对在线系统在目标业务的业务数据进行采样;基于采样的业务数据进行重采样操作以得到目标业务数据,所述重采样操作至少包括数据可信过滤操作;当未参与训练的目标业务数据达到预定数量时,基于预定数量的未参与训练的目标业务数据,对所述在线系统在所述目标业务的当前风险防控模型进行增量训练,以得到目标风险防控模型,其中,所述当前风险防控模型为孤立森林模型;将所述在线系统在所述目标业务的当前风险防控模型替换为所述目标风险防控模型。
技术领域
本申请涉及计算机软件技术领域,尤其涉及一种无监督风险防控模型的训练方法、更新方法及装置。
背景技术
为了拉新以及促进活跃用户培养用户粘性,交易平台经常会大量的资金用于营销。涉及的活动多种多样,包括发红包,奖励金,优惠券等等。这些资金会吸引一些黑产用户恶意获取平台的营销资金。对于这类风险,风险的来源通常是账户主本人操作,而非被恶意盗用,属于主动性风险。
该类风险有三个特点:一、涉及资金大,大量的营销资金在短时间内投入,一旦防控不好,将给平台造成巨大的损失。二、没有报回的黑样本,风控团队难以去观察当前的风险水位,以及针对性的防控,现有风控手段只能在事后通过规则对部分交易进行定性,以判断是否在套取营销资金。三、手法变异快,整个风险对抗是长期时刻都在变异的。
在当前的风控体系内,风险防控模型都是离线训练,最快能够T+1更新迭代部署到线上,对于风险对抗来说,响应速度是远远不足的。
发明内容
本申请实施例的目的是提供一种无监督风险防控模型的训练方法、更新方法及装置,能够提高对业务平台风险变动的感知速度,提高风险防控模型的更新速度,从而提高风险防控模型的风险检测效率。
为解决上述技术问题,本申请实施例是这样实现的:
第一方面,提出了一种无监督风险防控模型的更新方法,该方法包括:
基于预设时间间隔对在线系统在目标业务的业务数据进行采样;
基于采样的业务数据进行重采样操作以得到目标业务数据,所述重采样操作至少包括数据可信过滤操作;
当未参与训练的目标业务数据达到预定数量时,基于预定数量的未参与训练的目标业务数据,对所述在线系统在所述目标业务的当前风险防控模型进行增量训练,以得到目标风险防控模型,其中,所述当前风险防控模型为孤立森林模型;
将所述在线系统在所述目标业务的当前风险防控模型替换为所述目标风险防控模型。
第二方面,提出了一种无监督风险防控模型的更新装置,该装置包括:
采样模块,基于预设时间间隔对在线系统在目标业务的业务数据进行采样;
重采样模块,基于采样的业务数据进行重采样以得到目标业务数据,所述重采样至少包括数据可信过滤操作;
训练模块,当未参与训练的目标业务数据达到预定数量时,基于预定数量的未参与训练的目标业务数据,对所述在线系统在所述目标业务的当前风险防控模型进行增量训练,以得到目标风险防控模型,其中,所述当前风险防控模型为孤立森林模型;
更新模块,将所述在线系统在所述目标业务的当前风险防控模型替换为所述目标风险防控模型。
第三方面,提出了一种电子设备,该电子设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
基于预设时间间隔对在线系统在目标业务的业务数据进行采样;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910058892.3/2.html,转载请声明来源钻瓜专利网。