[发明专利]基于循环神经网络与注意力机制的金融用户画像方法有效
申请号: | 202110476016.X | 申请日: | 2021-04-29 |
公开(公告)号: | CN113468203B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 马明俊;杜德慧 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/2458;G06Q40/00;G06N3/04 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 循环 神经网络 注意力 机制 金融 用户 画像 方法 | ||
1.一种基于循环神经网络与注意力机制的金融用户画像方法,其特征在于,该方法包括如下具体步骤:
A:使用金融时序数据预处理技术对金融时序操作数据进行数据变换,得到金融特征向量;其中,金融特征向量包括用户操作信息及控件信息;
B:结合金融领域知识、专家经验及业务需求上层指导,使用可视化技术、聚类算法构建出金融用户标签系统;
C:使用Embedding机制对金融特征向量进行变换,生成一种更为稠密的金融特征向量;
D:将所述稠密的金融特征向量输入到融合了循环神经网络和用户操作注意力机制的金融用户画像模型中,输出金融用户画像标签结果值,并更新准确率;其中,准确率的初始值为0%;
E:迭代执行步骤C和步骤D,直至金融用户画像准确率至少80%终止;其中:
所述步骤A具体包括:
A1:对金融时序数据进行清洗和补齐操作,得到清洗和补齐的金融时序数据;
A2:对清洗和补齐后的金融时序数据进一步使用数据标准化操作,得到标准化金融时序数据;
A3:根据标准化金融时序数据,生成隐含的用户操作信息,隐含的用户操作特征与原有的金融时序数据共同构成金融特征向量;
A4:将金融特征向量按照七比三的比例进行分割,分成训练集和测试集;
步骤B所述使用可视化技术、聚类算法构建出金融用户标签系统,具体包括:
B1:使用可视化方法对金融特征数据进行展示分析,从中选取特征构成金融用户事实类标签;金融用户操作数据的事实类标签包含某个操作视图停留时间、某个产品的购买时间段及控件点击频率;金融用户基础数据的内容包括年龄段及出身地城市;
B2:使用聚类算法对金融特征数据进行聚类计算,选取聚类结果中占比高的金融特征向量,得到学习类标签;
B3:从金融公司的业务需求说明书中提取出现频率高的关键词,构建金融营销模型类标签;
所述步骤C具体包括:
C1:针对金融特征向量中的控件信息,使用Embedding机制进行变换得到控件信息的稠密向量;
C2:通过计算控件信息的稠密向量的平均值,得到用户操作信息的稠密向量;
所述步骤D具体包括:
D1:将用户操作信息的稠密向量输出到循环神经网络,由循环神经网络迭代地输出隐藏层向量;
D2:将循环神经网络的每一个时间步输出的隐藏层向量作为注意力机制的输入,对金融用户操作在“时间”维度进行注意力的学习,计算得到时序操作相似度权值;
D3:注意力机制进一步对隐藏层向量与时序操作相似度权值进行加权计算,输出一组多维向量,再通过SoftMax函数对这组多维向量归一化得到金融用户画像标签结果;
D4:通过对金融用户画像模型的标签值输出,更新准确率;其中,准确率的初始值为0%。
2.根据权利要求1所述的基于循环神经网络与注意力机制的金融用户画像方法,其特征在于,所述步骤A1中,对金融时序数据的清洗和补齐操作是以时间戳为依据的;具体包括:
A11:使用MYSQL连接查询语句、条件查询语句及删除语句,剔除冗余数据;
A12:使用MYSQL连接查询语句、条件查询语句及删除语句,剔除不一致数据;
A13:使用MYSQL连接查询语句、条件查询语句及插入语句,补齐缺失数据。
3.根据权利要求1所述基于循环神经网络与注意力机制的金融用户画像方法,其特征在于,步骤A3中所述生成隐含的用户操作特征,具体包括:
A31:生成统计类的用户操作特征,包括鼠标点击频率及交易频率;
A32:生成复合操作类的用户操作特征,包括截图命令及窗口切换。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110476016.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:谐振器及其形成方法、电子设备
- 下一篇:用于空调器的杀菌控制方法及空调器