[发明专利]信贷产品的利润估计方法、装置、电子设备及存储介质在审
申请号: | 202110116152.8 | 申请日: | 2021-01-27 |
公开(公告)号: | CN112837144A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 孙书恒;周旭强;杨轲;曹鹏 | 申请(专利权)人: | 成都新希望金融信息有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62;G06F17/18 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 余菲 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信贷 产品 利润 估计 方法 装置 电子设备 存储 介质 | ||
1.一种信贷产品的利润估计方法,其特征在于,所述方法包括:
计算待展业机构的企业端数据进行量化后得到的待展业量化数据与已展业机构的企业端数据的欧式距离;
基于所述欧氏距离确定与所述待展业量化数据的欧式距离最小的所述已展业机构的目标企业端数据;
在所述目标企业端数据中筛选出相关性低于第一阈值的变量得到筛选样本集;
基于所述筛选样本集提取得到所述筛选样本集对应的已展业机构的用户提现数据;
基于所述待展业量化数据、所述筛选样本集以及所述用户提现数据进行数据切分得到训练集、测试集以及时间外样本;
基于所述训练集、所述测试集以及所述时间外样本进行逻辑回归训练得到所述待展业机构的信贷产品的利润估计值系数;
基于所述利润估计值系数计算目标展业机构的利润估计值。
2.根据权利要求1所述的方法,所述待展业量化数据包括第一量化数据以及第二量化数据,其特征在于,在所述计算待展业机构的企业端数据进行量化后得到的待展业量化数据与已展业机构的企业端数据的欧式距离之前,所述方法包括:
将所述待展业机构的企业端数据中具有排序性的变量按照多个分位值划分为不同区间,并对各个变量的不同区间中的数据进行赋值得到具有排序性变量的所述第一量化数据,其中,同一区间中的数据赋值相同;
将所述待展业机构的企业端数据中不具有排序性的变量按照所述变量的比重进行赋值得到不具有排序性变量的所述第二量化数据。
3.根据权利要求2所述的方法,其特征在于,所述计算待展业机构的企业端数据进行量化后得到的待展业量化数据与已展业机构的企业端数据的欧式距离,包括:
基于所述待展业量化数据以及所述已展业机构的企业端数据,通过第一计算公式计算所述待展业量化数据与所述已展业机构的企业端数据的欧氏距离;
所述第一计算公式包括:
其中,Di表示第i个已展业机构的企业端数据与所述待展业量化数据的欧式距离,x0,j表示所述待展业量化数据中第j个变量的企业端数据,xi,j表示第i个已展业机构的企业端数据中第j个变量的数据,n表示第i个已展业机构的企业端数据中的变量的数目。
4.根据权利要求1所述的方法,所述利润估计值系数包括第一系数和第二系数,其特征在于,所述基于所述训练集、所述测试集以及所述时间外样本进行逻辑回归训练得到所述待展业机构的信贷产品的利润估计值系数,包括:
分别对所述训练集、所述测试集、所述时间外样本进行数据清洗,得到清洗后训练集、清洗后测试集以及清洗后时间外样本;
基于所述清洗后训练集、所述清洗后测试集、所述清洗后时间外样本以及第二计算公式进行逻辑回归训练得到利润估算系数;
所述第二计算公式包括:
Y=BX+CZ;
其中,Y表示所述清洗后训练集、所述清洗后测试集或者所述清洗后时间外样本中所述筛选样本集对应的已展业机构的用户提现数据,Z表示所述清洗后训练集、所述清洗后测试集或者所述清洗后时间外样本中所述筛选样本集的数据,X表示所述清洗后训练集、所述清洗后测试集或者所述清洗后时间外样本中所述待展业量化数据,B表示所述第一系数,C表示所述第二系数。
5.根据权利要求1所述的方法,其特征在于,在所述基于所述利润估计值系数计算目标展业机构的利润估计值之后,所述方法还包括:
在所述利润估计值不符合正态分布时,对得到的所述利润估算系数进行调整,直到基于调整后的利润估算系数计算出的所述目标展业机构的利润估计值符合正态分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都新希望金融信息有限公司,未经成都新希望金融信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110116152.8/1.html,转载请声明来源钻瓜专利网。