[发明专利]基于迁移学习分布式期望最大化金融数据聚类方法及系统在审
申请号: | 202111026341.2 | 申请日: | 2021-09-02 |
公开(公告)号: | CN113688934A | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 周劲;王荣荣;韩士元;王琳;杜韬;纪科;张坤;赵亚欧 | 申请(专利权)人: | 济南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/16;G06F17/18;G06N20/00 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 闫伟姣 |
地址: | 250022 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 迁移 学习 分布式 期望 最大化 金融 数据 方法 系统 | ||
1.一种基于迁移学习分布式期望最大化金融数据聚类方法,其特征在于,包括以下步骤:
获取待聚类客户金融数据的业务部门并将各部门数据进行集群分布式存储;
各个节点分别进行聚类分析,得到初始聚类结果,并基于各个节点上的初始聚类结果进行统计分析,得到迁移学习的初始模型参数集合;
根据设定的目标函数,基于当前模型参数集合计算当前模型目标函数值;在邻居节点之间进行模型参数迁移,计算新的模型目标函数值,若两次模型目标函数值的差值超过设定阈值,重复该步骤,否则,迭代终止;
对于各个节点上的每个数据点进行类别划分。
2.如权利要求1所述的基于迁移学习分布式期望最大化金融数据聚类方法,其特征在于,所述统计分析包括计算各个节点上每个类别所占比例、每个类别相应的簇均值和簇协方差矩阵。
3.如权利要求1所述的基于迁移学习分布式期望最大化金融数据聚类方法,其特征在于,所述聚类分析采用K-means++聚类方法。
4.如权利要求2所述的基于迁移学习分布式期望最大化金融数据聚类方法,其特征在于,所述参数迁移包括交换簇均值和簇逆协方差矩阵。
5.如权利要求4所述的基于迁移学习分布式期望最大化金融数据聚类方法,其特征在于,所述参数迁移还包括:
更新每个节点的后验概率、每个节点上各类别的混合比例、每个节点的簇均值与相应的拉格朗日乘子、每个节点的协方差矩阵与相应的拉格朗日乘子,以及,每个节点的迁移学习因子。
6.如权利要求4所述的基于迁移学习分布式期望最大化金融数据聚类方法,其特征在于,所述设定的目标函数为:
其中,t表示迭代次数,J表示节点个数,Nj表示第j个节点上的数据点个数,K表示类别个数,γjnk表示第j个节点第n个数据点第k类的后验概率,λji为第j个节点到第i个节点之间的学习因子,f(xjn;φjk)表示高斯分布函数,μjk表示第j个节点第k类的簇均值,∑jk表示第j个节点第k类的协方差矩阵。
7.如权利要求1所述的基于迁移学习分布式期望最大化金融数据聚类方法,其特征在于,对于各个节点上的每个数据点进行类别划分包括:对于各个节点上的每个数据点,选择其后验概率最大值所在的簇作为聚类结果。
8.一种基于迁移学习分布式期望最大化金融数据聚类系统,其特征在于,包括:
数据获取模块,用于获取待聚类客户金融数据的业务部门并将各部门数据进行集群分布式存储;
初始聚类模块,用于各个节点分别进行聚类分析,得到初始聚类结果,并基于各个节点上的初始聚类结果进行统计分析,得到迁移学习的初始模型参数集合;
迁移学习模块,用于根据设定的目标函数,基于当前模型参数集合计算当前模型目标函数值;在邻居节点之间进行模型参数迁移,计算新的模型目标函数值,若两次模型目标函数值的差值超过设定阈值,重复该步骤,否则,迭代终止;
类别划分模块,用于对于各个节点上的每个数据点进行类别划分。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7任一项所述基于迁移学习分布式期望最大化金融数据聚类方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述基于迁移学习分布式期望最大化金融数据聚类方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南大学,未经济南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111026341.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:锁扣型钢地下连续墙结构及其施工方法
- 下一篇:抛光治具、抛光治具组件及滚抛机