[发明专利]信息粒导向压缩快速聚类算法在审
申请号: | 201710157632.2 | 申请日: | 2017-03-16 |
公开(公告)号: | CN108629353A | 公开(公告)日: | 2018-10-09 |
发明(设计)人: | 徐楷杰;李志武;聂卫科;尹雨山;朱修彬 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/16 |
代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 李郑建 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类 导向矢量 快速聚类算法 压缩 高维数据 构造信息 压缩处理 复杂度 降维 算法 标准化 应用 | ||
本发明公开了一种信息粒导向压缩快速聚类算法,首先对信息粒数据进行标准化变换,将变换后的信息粒进行导向压缩变换,然后对导向矢量进行快速聚类;本发明通过对信息粒数据进行导向压缩处理,构造信息粒导向矢量,对信息粒导向矢量进行聚类,可以使高维数据降维,从而降低算法聚类复杂度,同时提升聚类效果;更适合实际应用。
技术领域
本发明属于大数据技术研究领域,具体涉及一种有效的导向压缩快速聚类算法,以提高聚类性能。
背景技术
在大数据时代,如何充分挖掘出蕴藏于数据资源中的价值正在成为各国IT业界、学术界和政府共同关注的焦点。数据挖掘中应用最为广泛的经典聚类算法之一的kmeans算法一直以来倍受学者们的青睐,针对kmeans算法自身的缺陷,如受迭代次数影响、受初始化中心的影响,当处理实际应用领域的复杂高维数据时,将会出现运算量大、收敛速度慢的缺陷。
发明内容
针对上述现有技术存在的不足,本发明的目的在于提供一种信息粒导向变相动态快速聚类算法,能更快聚类,聚类效果好,解决现有的聚类算法不易于收敛、运算量大的缺陷。
为解决上述技术问题,本发明采用了以下技术方案:
信息粒导向压缩快速聚类算法,包括以下步骤:
步骤一:对信息粒数据D作平移标准差变换,得到
信息粒数据D为:
变换之后的信息粒数据为:
其中,
xnm表示第n个数据的第m个属性,xn′m表示经平移标准差变换后的第n个数据的第m个属性,N表示信息粒数据的个数,每个数据有M个属性;
步骤二:对信息粒数据进行导向压缩变换;
步骤2.1:信息粒数据的导向矢量Ξ为:
其中,Λ为信息粒的导向压缩变换矢量,Λ=[cosθ1 cosθ2…cosθm…cosθM]T,且满足θm表示波长为λ的平行波辐射在信息粒上时该平行波束与M维空间标准正交坐标轴的正向夹角,m=1,2,...,M;
步骤2.2:对导向矢量Ξ的元素按从小至大的顺序进行排列,得到排序后的导向矢量Ξ′,Ξ′=[μ1 μ2…μn…μN];
其中,μn表示导向矢量Ξ的元素按从小至大排列后的元素。
步骤三:对排序后的导向矢量Ξ′进行聚类;
步骤3.1:选取排序后的导向矢量Ξ′中的K个元素作初始化聚类中心cj,j∈{1,2,...,K},K=1,2,...,N;
步骤3.2:将排序后的导向矢量Ξ′中其余元素分别分配给距离最近的聚类中心,使目标函数J的值最小,其中,
聚类完成后,得到K类数据;
步骤3.3:分别计算K类数据的均值,将获得的均值作为下一循环中新的K个聚类中心;
步骤3.4:重复3.2至3.3,直至满足预先设置的迭代次数或者聚类中心不再发生变化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710157632.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信息粒导向变相动态快速聚类算法
- 下一篇:目标检测方法及装置