[发明专利]特征因子确定方法及设备有效
申请号: | 201811549933.0 | 申请日: | 2018-12-18 |
公开(公告)号: | CN109670976B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 崔蓝艺 | 申请(专利权)人: | 泰康保险集团股份有限公司;泰康在线财产保险股份有限公司 |
主分类号: | G06Q40/08 | 分类号: | G06Q40/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 孙静;刘芳 |
地址: | 100031 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 因子 确定 方法 设备 | ||
1.一种特征因子确定方法,其特征在于,包括:
根据N个候选特征因子,获取基准特征曲线下基准AUC值,各所述候选特征因子分别用于描述一种类型的风控特征,所述风控特征的类型包括如下中的至少一种:投保特征、承保特征或理赔特征,所述N为大于或者等于2的整数;
根据各所述候选特征因子的重要性,获取AUC临界值以及AUC拟合曲线;
根据所述基准AUC值、所述AUC临界值以及所述AUC拟合曲线,在所述N个候选特征因子中确定目标特征因子;
所述根据所述基准AUC值、所述AUC临界值以及所述AUC拟合曲线,在所述N个候选特征因子中确定目标特征因子,包括:
将所述AUC临界值对应的候选特征因子存入第一特征因子组;
根据所述基准AUC值和所述AUC拟合曲线,获取AUC极值,所述AUC极值为大于所述基准AUC值,且小于所述AUC临界值的极大值或极小值;
针对每个AUC极值,获取所述AUC极值对应的M个候选特征因子;
针对所述M个候选特征因子中的每个候选特征因子,将所述候选特征因子存入至所述第一特征因子组,得到第二特征因子组;
将所述第二特征因子组中的特征因子输入训练模型,得到多个第一AUC值;
根据所述多个第一AUC值和所述AUC临界值,确定目标特征因子;
所述根据N个候选特征因子,获取基准特征曲线下基准AUC值包括:
将所述N个候选特征因子输入至训练模型中,获取基准特征曲线下基准AUC值,所述基准AUC值为基准特征曲线下与坐标轴围成的面积,所述AUC被定义为ROC曲线下与坐标轴围成的面积。
2.根据权利要求1所述的方法,其特征在于,所述根据各所述候选特征因子的重要性,获取AUC临界值以及AUC拟合曲线,包括:
从所述N个候选特征因子中删除重要性最低的特征因子,将剩余的N-1个候选特征因子输入训练模型,得到所述训练模型输出的AUC值;
从所述N-1个候选特征因子中删除重要性最低的特征因子,将剩余的N-2个候选特征因子输入所述训练模型,得到所述训练模型输出的AUC值;
重复执行删除重要性最低的特征因子的操作,直至剩余的从2个候选特征因子中删除重要性最低的特征因子,将1个候选特征因子输入所述训练模型,得到所述训练模型输出的AUC值;
根据得到的N-1个AUC值,获取所述AUC临界值以及所述AUC拟合曲线。
3.根据权利要求2所述的方法,其特征在于,所述根据得到的N-1个AUC值,获取所述AUC临界值以及所述AUC拟合曲线,包括:
将所述N-1个AUC值中的最大值作为所述AUC临界值;
对所述N-1个AUC值进行拟合,得到所述AUC拟合曲线。
4.根据权利要求1所述的方法,其特征在于,所述根据所述多个第一AUC值和所述AUC临界值,确定目标特征因子,包括:
若存在大于所述AUC临界值的第一AUC值以及小于所述AUC临界值的第一AUC值,则将大于所述AUC临界值的第一AUC值对应的候选特征因子和所述第一特征因子组中的特征因子作为所述目标特征因子。
5.根据权利要求1所述的方法,其特征在于,所述根据所述多个第一AUC值和所述AUC临界值,确定目标特征因子,包括:
若所有第一AUC值均大于所述AUC临界值,则将所述M个候选特征因子存入所述第一特征因子组,得到第三特征因子组;
将所述第三特征因子组中的特征因子输入到所述训练模型,得到第二AUC值;
根据所述第二AUC值和所述AUC临界值,确定目标特征因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司;泰康在线财产保险股份有限公司,未经泰康保险集团股份有限公司;泰康在线财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811549933.0/1.html,转载请声明来源钻瓜专利网。