[发明专利]一种基于密度峰值的数据流聚类方法及装置有效
申请号: | 201910324141.1 | 申请日: | 2019-04-22 |
公开(公告)号: | CN110163255B | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 孙红卫;张瑞;杜韬;王信堂;许婧文;朱连江 | 申请(专利权)人: | 济南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/2455;G06F16/2458 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 杨哲 |
地址: | 250022 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开公开了一种基于密度峰值的数据流聚类方法及装置,以密度峰值和模糊聚类方法为基础,首次提出的疑似离群点的概念,以宽度自适应采样窗口模型以及空间‑时间衰减机制为主要创新点,以提高算法对数据流聚类的效率为主要目标和出发点,创新性地提出了一种新的数据流聚类方法及装置,即一种基于密度峰值的数据流聚类方法及装置,在保障可观的聚类精度前提下,获得更高效的数据流聚类效果。 | ||
搜索关键词: | 一种 基于 密度 峰值 数据流 方法 装置 | ||
【主权项】:
1.一种基于密度峰值的数据流聚类方法,其特征在于,该方法包括:接收首批待聚类的数据流数据,初始化参数和数据结构;接收新一批待聚类的数据流数据作为新数据,进行新数据的预聚类,同时将旧有数据流数据进行衰减;将新一批待聚类的数据流数据和旧有数据流数据及其数据结构进行合并,并聚类合并后的数据,所述合并后的数据成为旧有数据;对旧有数据进行疑似离群点的筛选更新;所述疑似离群点为根据旧有数据计算的权值大于阈值的对象点;根据旧有数据的衰减情况确定下一迭代中数据采样窗口的宽度;根据采用密度峰值算法得到的疑似离群点的最大密度中心情况进行增簇,或根据现有簇心间的空间位置进行簇的合并;返回接收新一批待聚类的数据流数据的步骤继续数据流聚类迭代,当采样窗口到达待聚类的数据流尾部时,结束数据流聚类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南大学,未经济南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910324141.1/,转载请声明来源钻瓜专利网。