[发明专利]基于自适应在线学习的密度数据流聚类方法在审
申请号: | 202211094825.5 | 申请日: | 2022-09-05 |
公开(公告)号: | CN115496133A | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 刘若辰;张锦伟;张有;王晗丁 | 申请(专利权)人: | 西安电子科技大学;中国航发四川燃气涡轮研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F30/20 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自适应 在线 学习 密度 数据流 方法 | ||
1.一种基于自适应在线学习的数据流聚类方法,其特征在于,包括如下步骤:
(1)接收动态数据环境下的数据流,并将数据流中的数据按照接收顺序,以1000个数据点作为一个间隔,将数据流划分为n个数据块,n≥3;
(2)根据数据块中的第一个数据点信息单独创建一个微簇结构,并将该微簇加入到起始为空的微簇列表中;
(3)计算数据块中其他数据点Xi逐个与微簇列表中的微簇中心C的欧式距离d,并将数据点映射到欧式距离最小的微簇,判断当前数据点是否加入到微簇中:
若欧式距离小于被映射的微簇的最小半径R,即dR时,且该微簇是缓冲区中的弱微簇,此时微簇被激活成核心微簇,则将该微簇的能量变更为1,再将当前数据点加入到被映射的微簇,执行步骤(4);
否则,由当前数据点单独创建一个新的微簇结构,并加入到现有的微簇列表中,执行步骤(5);
(4)微簇列表中的微簇接收到一个新的数据点后,进行更新操作:
(4a)当数据点Xi加入后,对微簇的半径Rt进行自适应更新,得到更新后的微簇半径最新值Rt+1:
其中,Nt+1=Nt+1为微簇的局部密度阈值,N′t为微簇的空间信息计数值,Decay为微簇的衰减因子,的比值为自适应调整因子,Rmax为微簇最大半径;
(4b)当数据点Xi位于壳区域,即数据点在微簇中心位置[0.5*Rt+1,Rt+1]范围构成的空间区域时,对微簇中心Ct进行自适应更新,得到更新后的中心最新值Ct+1:
其中,N′t+1=N′t+1为微簇的空间信息计数值;
(4c)对微簇的能量Et进行自适应更新,得到更新后的能量最新值Et+1:
执行步骤(5);
(5)对微簇列表中的微簇能量E′t进行衰减,得到衰减后的能量最新值E′t+1:
执行步骤(6);
(6)根据衰减后的微簇能量值与0的大小关系,判断当前时刻微簇是否发生变化:
如果微簇衰减后的能量值小于0,则该微簇发生变化,并根据微簇的类型进行相应的变化:若微簇是局部密度阈值Nt大于密度阈值Nth的核心微簇,将其变成缓冲区中弱微簇,对弱微簇的结构进行相应的变化;否则,微簇是缓冲区中的弱微簇,将其直接删除;
如果微簇衰减后的能量值大于等于0时,则微簇不发生变化,执行步骤(7);
(7)计算当前微簇与微簇列表中所有微簇的相交距离d′,将微簇中心的欧式距离d小于相交距离d′的微簇加入到各自的边缘列表EL中,即将属于相交的微簇划分为同一类,实现对宏观集群的更新;
(8)将更新宏观集群后属于同一类的结果在线输出,完成对数据流的聚类。
2.根据权利要求书1所述的方法,其特征在于,所述步骤(2)中微簇结构包括中心C、半径R、能量E、局部密度阈值N、空间信息计数N′和边缘列表EL,其中,C=Xi,Xi为当前数据点,E=1,R=Rmin,Rmin为用户输入的最小半径,N=1,N′=1,EL初始化为空集
3.根据权利要求书1所述的方法,其特征在于,所述步骤(6)中对弱微簇的结构进行相应的变化,是先将弱微簇的能量变为0.5,再将弱微簇边缘列表中的微簇找出,然后将微簇与弱微簇的信息记录清除,最后将弱微簇的边缘列表置成空集
4.据权利要求书1所述的方法,其特征在于,所述步骤(7)中计算当前微簇与微簇列表中所有微簇的相交距离d′,公式如下:
其中,R是当前微簇的半径,R′是微簇列表中微簇的半径。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学;中国航发四川燃气涡轮研究院,未经西安电子科技大学;中国航发四川燃气涡轮研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211094825.5/1.html,转载请声明来源钻瓜专利网。