[发明专利]基于融合神经网络特征挖掘的个人信用评估方法与系统在审
申请号: | 202110072423.4 | 申请日: | 2021-01-19 |
公开(公告)号: | CN112819604A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 杨明;周雪海;黄丽丽;许睿;张钱东 | 申请(专利权)人: | 浙江省农村信用社联合社 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州中成专利事务所有限公司 33212 | 代理人: | 周世骏 |
地址: | 310000 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 融合 神经网络 特征 挖掘 个人信用 评估 方法 系统 | ||
1.一种基于融合神经网络特征挖掘的个人信用评估方法,其特征在于,包括以下步骤:对个人用户的行为数据进行预处理和检验操作后进行矩阵化,所得数据同时作为长短期记忆神经网络模型和卷积神经网络模型的输入;在LSTM模型中,依次经过嵌入层、双向长短期记忆神经网络和注意力机制层的处理,输出从数据中提取的时序行为特征向量;在CNN模型中,依次经过卷积层和池化层的处理,输出从数据中提取的局部行为特征向量;将两类特征向量进行向量拼接后作为XGBoost分类器的输入并进行训练,最终得到个人信用评估结果。
2.根据权利要求1所述的方法,其特征在于,所述个人用户行为数据的来源包括银行内部的不同信息系统和银行外部的多个行政部门、机构及渠道;行为数据的类型包括动态数据和静态数据,前者是指反映个人用户随时间动态变化的数据,后者是指反映个人用户基本特征的数据。
3.根据权利要求1所述的方法,其特征在于,所述对个人用户的行为数据进行预处理,具体包括:对个人用户行为数据的字段类型、长度、输入输出格式进行检查;将不同来源的数据进行纵向拼接,形成完整的宽表;对拼接后的数据进行数据检查,统计字段缺失率,剔除缺失率高于限定值或无明显业务含义的字段;合并共有字段、统一字段类型并重新定义新字段属性;
所述的检验操作是指对经过预处理的数据样本的正确性进行校验,包括:提取样本数据中的身份证号码字段,与数据库中已存储信息进行校验;根据校验结果对各样本数据进行更正,剔除非身份证数据导致的无法校验样本,纠正与已存储信息不匹配样本的出生日期和性别数据;完成出生日期校验后创建年龄字段,更新系统指标库。
4.根据权利要求1所述的方法,其特征在于,所述矩阵化是指,采用矩阵化的方式对个人用户的行为数据进行编码,以时间为轴将用户行为特征根据时间点进行排列;针对数据的稀疏性,按照时间切片对用户行为数据进行重采样,将用户汇总数据按照时间先后进行排列,无记录的情况统一填充为固定值,用户不同行为的序列按照时间进行对齐;通过上述方式实现不同个人用户数据之间的统一,并以矩阵代表用户在不同时间点的所有行为特征。
5.根据权利要求1所述的方法,其特征在于,在使用长短期记忆神经网络模型进行数据处理时,具体包括:
(1)利用嵌入层将近似为多变量序列数据中的每个行为向量映射到维度更低的空间,并且将其输出结果作为BiLSTM网络的输入;以BiLSTM网络作为序列预测模型,捕获不同序列方向更多的用户特征信息;在得出正反层两组特征向量后进行拼接,作为BiLSTM网络隐藏层的结果;
(2)以BiLSTM网络隐藏层的结果作为注意力机制层的输入向量,对BiLSTM网络输出的各节点进行重要度计算;利用softmax函数的归一性将每个节点的权重映射到[0,1]之间,最后将权重向量与隐藏层的输出结果进行加和汇总,得到一维化的时序行为特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江省农村信用社联合社,未经浙江省农村信用社联合社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110072423.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:植物保健饮料
- 下一篇:一种废弃护理用品回收再利用处理系统