[发明专利]数据处理方法和数据处理装置在审
申请号: | 202110728727.1 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113362176A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 段景初;任晓谢;夏振全;刘景涛;曹叶静 | 申请(专利权)人: | 中国农业银行股份有限公司 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06N20/00 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;黄健 |
地址: | 100005 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 | ||
1.一种数据处理方法,其特征在于,包括:
获取待预测时间段的用户合约数据、用户授信数据以及用户交易数据,所述用户合约数据包括至少一个用户中每个用户的理财合约信息、基金合约信息、保险合约信息、外汇合约信息或债券合约信息中的至少一个,所述用户授信数据包括所述每个用户在所述待预测时间段的授信额度,所述用户交易数据包括所述每个用户的业务交易特性,所述业务交易特性包括交易的时间特征、所述交易的频次特征、所述交易的金额特征或所述交易的产品类型特征中的至少一个;
将所述用户合约数据、所述用户授信数据以及所述用户交易数据输入至机器学习模型,获得所述每个用户在未来时间段的预测授信额度,所述机器学习模型是基于第一历史时间段的用户合约数据、用户授信数据、用户交易数据以及所述第一历史时间段的用户的未来实际授信额度训练得到的。
2.根据权利要求1所述的方法,其特征在于,所述业务交易特性包括下列至少一个:
动账交易特性、出入金交易特性、查询交易特性、股票交易特性或外汇交易特性。
3.根据权利要求1所述的方法,其特征在于,所述用户授信数据还包括下列至少一个:
所述待预测时间段内所述每个用户的授信额度之和、所述待预测时间段内所述每个用户的授信额度的平均值、所述待预测时间段内所述每个用户的授信额度的最大值、或所述待预测时间段内所述每个用户的授信额度的最小值。
4.根据权利要求1所述的方法,其特征在于,在所述获取待预测时间段的用户合约数据、用户授信数据以及用户交易数据之前,所述方法还包括:
确定所述机器学习模型的目标准确率;
所述获取待预测时间段的用户合约数据、用户授信数据以及用户交易数据,包括:
在所述目标准确率大于或者等于阈值的情况下,获取所述待预测时间段的用户合约数据、用户授信数据以及用户交易数据。
5.根据权利要求4所述的方法,其特征在于,所述确定所述机器学习模型的目标准确率,包括:
确定N个训练集和N个测试集,所述N个训练集合和所述N个测试集一一对应,N≥2;
基于所述N个训练集和所述N个测试集分别对所述机器学习模型进行验证,获得N个准确率;
基于所述N个准确率,确定所述目标准确率。
6.根据权利要求5所述的方法,其特征在于,所述目标准确率为所述N个准确率的平均值。
7.根据权利要求5所述的方法,其特征在于,所述确定N个训练集和N个测试集,包括:
获取验证数据,所述验证数据包括第二历史时间段的用户合约数据、用户授信数据、用户交易数据以及所述第二历史时间段的用户的未来实际授信额度;
将所述第二历史时间段划分为连续的N个子历史时间段,所述N个子历史时间段分别对应N个子验证数据;
将所述N个子验证数据中第i个子验证数据确定为所述N个测试集中的第i个测试集;
将所述N个子验证数据中除所述第i个子验证数据之外剩余的N-1个子验证数据确定为所述N个训练集中的第i个训练集,i为大于或等于1的整数,且i取遍{1,2,…,N}。
8.根据权利要求7所述的方法,其特征在于,所述基于所述N个训练集和所述N个测试集分别对所述机器学习模型进行验证,获得N个准确率,包括:
基于所述第i个训练集,获得训练后的所述机器学习模型;
将所述第i个测试集输入所述训练后的机器学习模型,获得待验证授信额度;
基于所述待验证授信额度和所述第i个子验证数据中的未来实际授信额度,得到所述N个准确率中的第i个准确率。
9.根据权利要求4所述的方法,其特征在于,所述方法还包括:
在确定所述目标准确率小于所述阈值的情况下,优化所述机器学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司,未经中国农业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110728727.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种视频数据的传输方法和装置
- 下一篇:预警方法、装置和服务器