[发明专利]资金流向分类方法、装置、设备、介质及产品在审
申请号: | 202211123733.5 | 申请日: | 2022-09-15 |
公开(公告)号: | CN115456078A | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 吴欢;王大猷;林慕云;许承飞 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q40/02;G06Q40/04 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 吴会英;黄健 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 资金 流向 分类 方法 装置 设备 介质 产品 | ||
1.一种资金流向分类方法,其特征在于,包括:
获取待分类的贴现数据;所述待分类的贴现数据包括:待分类的贴现行为对应的历史行为数据及贴现基本数据;
提取待分类的贴现数据的降维特征对应的待分类特征值;所述降维特征是从初始特征中确定的,所述初始特征的数量大于降维特征的数量;所述初始特征是待分类的贴现数据中可提取的特征;
将所述待分类特征值输入训练完成的资金流向分类模型中对待分类特征对应的贴现数据进行分类,以确定贴现数据对应的贴现后的资金流向是否异常。
2.根据权利要求1所述的方法,其特征在于,所述提取待分类的贴现数据的降维特征对应的待分类特征值之前,包括:
获取多个历史贴现数据;所述历史贴现数据包括历史贴现行为对应的历史行为数据及贴现基本数据;
提取各历史贴现数据的初始特征对应的特征值,并将提取的各历史贴现数据的初始特征对应的特征值确定为初始样本数据;
采用随机森林算法根据初始样本数据从各初始特征中确定降维特征。
3.根据权利要求2所述的方法,其特征在于,所述采用随机森林算法根据初始样本数据从各初始特征中确定降维特征,包括:
采用随机森林算法根据初始样本数据确定各初始特征的权重;
将各初始特征按照对应权重从大到小的顺序排序;
将在预设排名之前的初始特征确定为降维特征。
4.根据权利要求3所述的方法,其特征在于,所述采用随机森林算法根据初始样本数据确定各初始特征的权重,包括:
根据初始样本数据建立多个决策树,并将多个决策树组合为随机森林;所述决策树中包括预设数量的初始特征;
确定各决策树中的初始特征在决策树中的特征分权重;
将初始样本数据输入建立完成的随机森林中,以确定各决策树的权重;
将所述特征分权重与决策树的权重加权求和的计算结果确定为各初始特征的权重。
5.根据权利要求4所述的方法,其特征在于,所述确定各决策树中的初始特征在决策树中的特征分权重,包括:
根据各决策树中的初始特征的信息增益熵确定各决策树中的初始特征在决策树中的特征分权重。
6.根据权利要求4所述的方法,其特征在于,所述将初始样本数据输入建立完成的随机森林中,以确定各决策树的权重,包括:
将初始样本数据输入建立完成的随机森林中,以使随机森林中各决策树及随机森林对初始样本数据进行分类;
计算决策树的对初始样本数据的分类与随机森林的对初始样本数据的分类一致的一致输出占比;
根据各决策树的一致输出占比确定各决策树的权重。
7.根据权利要求2-6任一项所述的方法,其特征在于,所述提取待分类的贴现数据的降维特征对应的待分类特征值,包括:
获取初始特征中降维特征的类别;
按照所述初始特征中降维特征的类别从待分类的贴现数据中提取相同类别的降维特征;
确定待分类的贴现数据的降维特征对应的待分类特征值。
8.根据权利要求1-6任一项所述的方法,其特征在于,所述训练完成的资金流向分类模型中包括训练完成的K均值聚类算法;所述训练完成的K均值聚类算法中包括训练完成的资金分类聚类中心;将所述待分类特征值输入训练完成的资金流向分类模型中对待分类特征对应的贴现数据进行分类,以确定贴现数据对应的贴现后的资金流向是否异常,包括:
计算待分类特征值与各训练完成的资金分类聚类中心的欧式距离;
根据欧式距离最大的对应的资金分类聚类中心确定待分类特征对应的贴现后的资金流向是否异常。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211123733.5/1.html,转载请声明来源钻瓜专利网。