[发明专利]一种数据处理方法、装置、设备及存储介质在审
申请号: | 201910124234.X | 申请日: | 2019-02-18 |
公开(公告)号: | CN111583011A | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 董健;常富洋;颜水成 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06F17/18 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 王玉双 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 设备 存储 介质 | ||
本说明书实施例提供了一种数据处理方法、装置、设备及存储介质。其方法包括:利用第一用户特征样本数据训练得到事件逾期概率模型;获取多个第二用户特征样本数据,并利用所述事件逾期概率模型获取每个所述第二用户特征样本数据对应的事件逾期概率;获取多个事件逾期概率大于设定的逾期概率阈值的第二用户特征样本数据作为第三用户特征样本数据,并对所述第三用户特征样本数据进行分组;利用增强学习模型分别获取每组第三用户特征样本数据的预估奖励值和预估不确定性值;选择预估奖励值与预估不确定性之和最大的第三用户特征样本数据的事件逾期概率;利用选择的所述事件逾期概率调整所述事件逾期概率阈值。本发明实施例可准确调整逾期概率阈值。
技术领域
本说明书实施例涉及数据处理技术领域,尤其涉及一种数据处理方法、装置、设备及存储介质。
背景技术
近些年,互联网金融蓬勃发展。互联网金融核心之一的贷款业务,最重要的是判断是否对用户贷款。目前主流的还款逾期模型通常基于已有放款表现的用户,利用这些用户的用户特征数据作为样本进行监督学习训练得到。这种模型训练方式以及得到的还款逾期模型难以对被拒绝放款或者无放款表现的用户进行准确评估,导致后续模型优化使用的样本均为正样本,使得模型过收敛,模型准确度降低。
发明内容
本说明书实施例提供及一种数据处理方法、装置、设备及存储介质,通过智能调整事件逾期概率阈值,可有效进行用户下探,丰富模型优化样本,提高模型准确度。
第一方面,本说明书实施例提供一种数据处理方法,包括:
获取多个第一用户特征样本数据,第一用户特征样本数据为有标签样本数据,并利用第一用户特征样本数据训练得到事件逾期概率模型;
获取多个第二用户特征样本数据,第二用户特征样本数据为无标签样本数据,并利用事件逾期概率模型获取每个第二用户特征样本数据对应的事件逾期概率;
获取多个事件逾期概率大于设定的逾期概率阈值的第二用户特征样本数据作为第三用户特征样本数据;
利用增强学习模型分别获取每个第三用户特征样本数据的预估奖励值和预估不确定性值;
选择预估奖励值与预估不确定性之和最大的第三用户特征样本数据的事件逾期概率;
利用选择的所述事件逾期概率调整所述事件逾期概率阈值。
结合第一方面,在本发明实施例第一方面的第一种实现方式中,所述增强学习模型包括线性模型和上下文赌博机,所述利用增强学习模型分别获取每个第三用户特征样本数据的预估奖励值和预估不确定性值,包括:
利用所述线性模型分别获取每个第三用户特征样本数据对应的预估奖励;
利用所述上下文赌博机分别获取每个第三用户特征样本数据对应的预估不确定性值。
结合第一方面的第一种实现方式,在本发明实施例第一方面的第二种实现方式中,所述利用所述线性模型分别获取每个第三用户特征样本数据对应的预估收益,包括:
获取每个第三用户特征样本数据的事件特征数据;
将所述每个第三用户特征样本数据各自的事件特征数据、各自的事件逾期概率作为输入值,利用所述线性模型分别获取每个第三用户特征样本数据对应的预估奖励。
结合第一方面的第二种实现方式,在本发明实施例第一方面的第三种实现方式中,所述事件特征数据包括以下至少一种:
目标对象所在区域数据,目标对象收入数据,目标对象学历数据。
结合第一方面的第一种实现方式,在本发明实施例第一方面的第四种实现方式中,所述利用所述上下文赌博机分别获取每个第三用户特征数据对应的预估不确定性值,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910124234.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:压缩机的机架组件和压缩机
- 下一篇:语音识别用于特定目标唤醒的方法及装置