[发明专利]风险评分模型的构建方法、装置、存储介质及终端在审
申请号: | 201810030179.3 | 申请日: | 2018-01-12 |
公开(公告)号: | CN108269012A | 公开(公告)日: | 2018-07-10 |
发明(设计)人: | 于洋;刘杰;马宁;谢波;孙家棣 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/08;G06K9/62 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 阳开亮 |
地址: | 518000 广东省深圳市福田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本库 评分模型 构建 分类特征 贡献度 算法 存储介质 数据构建 随机森林 噪声干扰 决策树 时效性 聚类 预设 终端 筛选 | ||
本发明提供了一种风险评分模型的构建方法,所述构建方法包括:根据预设的帐号数据构建黑名单样本库和白名单样本库,所述黑名单样本库中包括异常帐号,所述白名单样本库中包括正常帐号;基于梯度提升决策树GBDT算法对所述黑名单样本库中的异常帐号和白名单样本库中的正常帐号进行聚类训练,筛选出异常帐号分类特征;基于随机森林RF算法对所述异常帐号分类特征进行训练,获取每一个异常帐号分类特征对应的贡献度;根据所述异常帐号分类特征及其对应的贡献度,构建风险评分模型,所述风险评分模型用于识别异常帐号。本发明所构建的风险评分模型提高了清除异常帐号的时效性,降低了异常帐号带来的噪声干扰,提升了APP诸多指标的计算精度。
技术领域
本发明属于通信技术领域,尤其涉及一种风险评分模型的构建方法、装置、存储介质及终端。
背景技术
目前寿险类APP中存在大量异常的虚假注册用户,这些虚假注册用户存在刷活跃度、刷活动等行为。而APP的活跃率为登录APP的次数与用户总量的比值,转化率为获客数量与购买产品的用户数量的比值。现有的异常帐号识别方法为事后分析等被动识别机制,清除异常帐号的时效性和精度低,从而导致虚假注册用户对APP活跃率和转化率的评估和提升带来了极大的噪声干扰,降低了APP诸多指标的计算精度。此外,由于虚假注册用户的需求刺激,不法分子还应用APP内在的漏洞完成异常帐号的注册,衍生出多种多样的异常用户注册版本,存在较大的安全。
发明内容
本发明实施例提供了一种风险评分模型的构建方法、装置、存储介质及终端,以提高清除异常帐号的时效性,降低异常帐号带来的噪声干扰,提升APP诸多指标的计算精度。
本发明实施例提供了一种风险评分模型的构建方法,所述构建方法包括:
根据预设的帐号数据构建黑名单样本库和白名单样本库,所述黑名单样本库中包括异常帐号,所述白名单样本库中包括正常帐号;
基于梯度提升决策树GBDT算法对所述黑名单样本库中的异常帐号和白名单样本库中的正常帐号进行聚类训练,筛选出异常帐号分类特征;
基于随机森林RF算法对所述异常帐号分类特征进行训练,获取每一个异常帐号分类特征对应的贡献度;
根据所述异常帐号分类特征及其对应的贡献度,构建风险评分模型,所述风险评分模型用于识别异常帐号。
进一步地,所述构建风险评分模型,之后还包括:
采用所述风险评分模型计算所述白名单样本库中的每一个正常帐号对应的风险评分;
将风险评分高于或等于预设的风险阈值的正常帐号过滤,保留风险评分低于预设的风险阈值的正常帐号;
采用所述风险评分模型计算所述黑名单样本库中的每一个异常帐号对应的风险评分;
根据所保留的正常帐号的风险评分和异常帐号的风险评分,校正所述风险阈值。
进一步地,所述基于梯度提升决策树GBDT算法对所述黑名单样本库中的异常帐号和白名单样本库中的正常帐号进行聚类训练包括:
获取每一所述异常帐号、正常帐号的特征信息对应的样本值;
根据所述特征信息对应的样本值,按照预测的特征条件将所述异常帐号、正常帐号分配至GBDT模型中的首棵回归决策树,直至每个异常帐号、正常帐号均分配至每一个叶子节点;
获取损失函数,初始化损失函数极小化的常数值;
针对每一个叶子节点,根据所述损失函数和常数值估算每一所述异常帐号、正常帐号对应的残差近似值;
基于所有残差近似值迭代训练下一棵回归决策树。
进一步地,所述异常帐号分类特征包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810030179.3/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理