[发明专利]基于用户APP独热编码的风险评估方法、装置和电子设备有效
申请号: | 202010275324.1 | 申请日: | 2020-04-09 |
公开(公告)号: | CN111582649B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 聂婷婷;张蓉;姚王照 | 申请(专利权)人: | 上海淇毓信息科技有限公司 |
主分类号: | G06Q10/0635 | 分类号: | G06Q10/0635;G06N20/00 |
代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 李博 |
地址: | 201500 上海市崇明区横沙乡富民*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 app 编码 风险 评估 方法 装置 电子设备 | ||
1.一种基于用户APP独热编码的风险评估方法,用于评估用户的金融风险,其特征在于,包括:
获取与用户关联的移动终端的APP安装列表信息,所述用户包括历史用户和新用户;
获取多个APP的用户覆盖度;所述APP的用户覆盖度是特定区域范围内安装了该APP用户的人数;
按照所述APP的用户覆盖度由大到小的顺序对所述多个APP排序形成序列;
选取所述序列中排名在前预设数量的APP作为APP集合中的APP;
根据所述APP安装列表信息进行独热编码,获得与用户关联的独热编码特征,包括:将用户的APP安装列表与所述APP集合比较,当APP集合中的某个APP与APP安装列表中的APP匹配成功时,将该APP转换为第一独热编码特征;当APP集合中的某个APP与APP安装列表中的APP匹配失败时,将该APP转换为第二独热编码特征;独热编码特征的维度与APP集合中的APP数量相同;
建立机器学习模型,使用历史用户的独热编码特征及其金融表现数据训练该机器学习模型;
将新用户的独热编码特征输入训练好的机器学习模型,计算该新用户的风险评分。
2.根据权利要求1所述的方法,其特征在于,根据所述APP安装列表信息进行独热编码,获得与用户关联的独热编码特征,进一步包括:
根据所述APP安装列表信息获得APP安装数量,根据APP安装数量是否超过预定值进行独热编码,将此独热编码与上述独热编码特征进行拼接形成新的独热编码特征。
3.根据权利要求1所述的方法,其特征在于,根据所述APP安装列表信息进行独热编码,获得与用户关联的独热编码特征,进一步包括:
根据所述APP安装列表信息获得特定类型的APP安装数量,根据该特定类型的APP安装数量是否超过预定值进行独热编码,将此独热编码与上述独热编码特征进行拼接形成新的独热编码特征。
4.根据权利要求3所述的方法,其特征在于,所述特定类型为多个,由此产生多个独热编码特征。
5.根据权利要求3所述的方法,其特征在于,所述特定类型包括以下的任意一种:金融类、贷款类、理财类、社交类、游戏类、工作类。
6.根据权利要求1所述的方法,其特征在于,所述机器学习模型是极端梯度提升模型。
7.一种基于用户APP独热编码的风险评估装置,其特征在于,包括:
信息获取模块,用于获取与用户关联的移动终端的APP安装列表信息,所述用户包括历史用户和新用户;
信息编码模块,用于根据所述APP安装列表信息进行独热编码,获得与用户关联的独热编码特征;
模型训练模块,用于建立机器学习模型,使用历史用户的独热编码特征及其金融表现数据训练该机器学习模型;
特征训练模块,将新用户的独热编码特征输入训练好的机器学习模型,计算该新用户的风险评分;
其中:所述信息编码模块进一步包括:
覆盖度获取单元,用于获取多个APP的用户覆盖度;所述APP的用户覆盖度是特定区域范围内安装了该APP用户的人数;
排序单元,用于按照所述APP的用户覆盖度由大到小的顺序对所述多个APP排序形成序列;
筛选单元,用于选取所述序列中排名在前预设数量的APP作为APP集合中的APP;
比较单元,用于根据所述APP安装列表信息进行独热编码,获得与用户关联的独热编码特征,包括:将用户的APP安装列表与所述APP集合比较,当APP集合中的某个APP与APP安装列表中的APP匹配成功时,将该APP转换为第一独热编码特征;当APP集合中的某个APP与APP安装列表中的APP匹配失败时,将该APP转换为第二独热编码特征;独热编码特征的维度与APP集合中的APP数量相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海淇毓信息科技有限公司,未经上海淇毓信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010275324.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理