[发明专利]用于风险识别模型的衍生变量选择方法和装置有效
申请号: | 202010244612.0 | 申请日: | 2020-03-31 |
公开(公告)号: | CN111461892B | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 付大鹏;赵闻飙 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06Q40/06 | 分类号: | G06Q40/06;G06Q20/40;G06N3/12 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许志勇 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 风险 识别 模型 衍生 变量 选择 方法 装置 | ||
本说明书实施例公开了一种用于风险识别模型的衍生变量选择方法、装置及电子设备、存储介质,涉及风险识别领域。通过根据目标遗传算法模型及其种子池生成的衍生变量的质量,确定目标遗传算法模型更新后的种子池,且更新后的种子池包括更新前种子池生成的N个质量最优的衍生变量的父本集合;然后根据第一父本累积变量集合和第二父本累积变量集合,以衍生变量质量最优的变异方向确定目标衍生变量集合,输出目标衍生变量集合中的衍生变量,以作为风险识别模型的样本特征。
技术领域
本说明书实施例涉及风险识别技术领域,尤其涉及一种用于风险识别模型的衍生变量选择方法和装置。
背景技术
对风险特征进行识别,是当前很多理财应用程序、电子支付应用程序等对风险敏感度比较高的场景必备的对用户的利益进行保护的功能。基于上述的场景,用户的交易和账户风控有着极强的对抗性,对应着多种多样的资金风险类型,不法分子会针对现有风控体系,绕过各种风险识别以盗用钱财或违规交易。究其原因,对风险识别模型进行训练的样本数据库的作为训练样本的风险特征的数量及多样性存在不足。
现有技术中,增加风险特征的数量及多样性的方式为:利用穷举方法进行对风险特征进行暴力衍生,然后基于预设的筛选条件(特征重要度大于预设的阈值)进行特征筛选,需要消耗大量的计算资源及时间成本,并且得到的风险特征集合的质量偏低。
发明内容
本说明书实施例的目的是提供一种用于风险识别模型的衍生变量选择方法和装置,以提高风险特征集合的选择效率和质量。
第一方面,本说明书实施例提供了一种用于风险识别模型的衍生变量选择方法,包括:
根据目标遗传算法模型及其种子池生成的衍生变量的质量,确定目标遗传算法模型更新后的种子池,其中,衍生变量的质量用于评估衍生变量作为目标业务的风险识别模型的样本特征的贡献,更新后的种子池包括更新前种子池生成的N个质量最优的衍生变量的父本集合;
根据第一父本累积变量集合和第二父本累积变量集合,以衍生变量质量最优的变异方向确定目标衍生变量集合,其中,第一父本累积变量集合和第二父本累积变量集合是基于目标遗传算法模型更新后的种子池选择的衍生变量父本;
如果目标衍生变量集合满足衍生变量的质量收敛条件,输出目标衍生变量集合中的衍生变量,以作为风险识别模型的样本特征;其中,
根据第一父本累积变量集合和第二父本累积变量集合,以衍生变量质量最优的变异方向确定目标衍生变量集合,包括:
根据第一父本累积变量集合,通过衍生变量父本匹配模型在第二父本累积变量集合中选择第一父本累积变量集合中的第一父本所匹配的M个第二父本,以生成候选衍生变量集合;
在候选衍生变量集合中选择N个质量最优的衍生变量作为目标衍生变量集合。
第二方面,本说明书实施例还提供了一种用于风险识别模型的衍生变量选择装置,包括:
种子池确定模块,根据目标遗传算法模型及其种子池生成的衍生变量的质量,确定目标遗传算法模型更新后的种子池,其中,衍生变量的质量用于评估衍生变量作为目标业务的风险识别模型的样本特征的贡献,更新后的种子池包括更新前种子池生成的N个质量最优的衍生变量的父本集合;
衍生变量确定模块,根据第一父本累积变量集合和第二父本累积变量集合,以衍生变量质量最优的变异方向确定目标衍生变量集合,其中,第一父本累积变量集合和第二父本累积变量集合是基于目标遗传算法模型更新后的种子池选择的衍生变量父本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010244612.0/2.html,转载请声明来源钻瓜专利网。