[发明专利]信息粒导向压缩快速聚类算法在审

专利信息
申请号: 201710157632.2 申请日: 2017-03-16
公开(公告)号: CN108629353A 公开(公告)日: 2018-10-09
发明(设计)人: 徐楷杰;李志武;聂卫科;尹雨山;朱修彬 申请(专利权)人: 西安电子科技大学
主分类号: G06K9/62 分类号: G06K9/62;G06F17/16
代理公司: 西安恒泰知识产权代理事务所 61216 代理人: 李郑建
地址: 710071*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 聚类 导向矢量 快速聚类算法 压缩 高维数据 构造信息 压缩处理 复杂度 降维 算法 标准化 应用
【说明书】:

发明公开了一种信息粒导向压缩快速聚类算法,首先对信息粒数据进行标准化变换,将变换后的信息粒进行导向压缩变换,然后对导向矢量进行快速聚类;本发明通过对信息粒数据进行导向压缩处理,构造信息粒导向矢量,对信息粒导向矢量进行聚类,可以使高维数据降维,从而降低算法聚类复杂度,同时提升聚类效果;更适合实际应用。

技术领域

本发明属于大数据技术研究领域,具体涉及一种有效的导向压缩快速聚类算法,以提高聚类性能。

背景技术

在大数据时代,如何充分挖掘出蕴藏于数据资源中的价值正在成为各国IT业界、学术界和政府共同关注的焦点。数据挖掘中应用最为广泛的经典聚类算法之一的kmeans算法一直以来倍受学者们的青睐,针对kmeans算法自身的缺陷,如受迭代次数影响、受初始化中心的影响,当处理实际应用领域的复杂高维数据时,将会出现运算量大、收敛速度慢的缺陷。

发明内容

针对上述现有技术存在的不足,本发明的目的在于提供一种信息粒导向变相动态快速聚类算法,能更快聚类,聚类效果好,解决现有的聚类算法不易于收敛、运算量大的缺陷。

为解决上述技术问题,本发明采用了以下技术方案:

信息粒导向压缩快速聚类算法,包括以下步骤:

步骤一:对信息粒数据D作平移标准差变换,得到

信息粒数据D为:

变换之后的信息粒数据为:

其中,

xnm表示第n个数据的第m个属性,xnm表示经平移标准差变换后的第n个数据的第m个属性,N表示信息粒数据的个数,每个数据有M个属性;

步骤二:对信息粒数据进行导向压缩变换;

步骤2.1:信息粒数据的导向矢量Ξ为:

其中,Λ为信息粒的导向压缩变换矢量,Λ=[cosθ1 cosθ2…cosθm…cosθM]T,且满足θm表示波长为λ的平行波辐射在信息粒上时该平行波束与M维空间标准正交坐标轴的正向夹角,m=1,2,...,M;

步骤2.2:对导向矢量Ξ的元素按从小至大的顺序进行排列,得到排序后的导向矢量Ξ′,Ξ′=[μ1 μ2…μn…μN];

其中,μn表示导向矢量Ξ的元素按从小至大排列后的元素。

步骤三:对排序后的导向矢量Ξ′进行聚类;

步骤3.1:选取排序后的导向矢量Ξ′中的K个元素作初始化聚类中心cj,j∈{1,2,...,K},K=1,2,...,N;

步骤3.2:将排序后的导向矢量Ξ′中其余元素分别分配给距离最近的聚类中心,使目标函数J的值最小,其中,

聚类完成后,得到K类数据;

步骤3.3:分别计算K类数据的均值,将获得的均值作为下一循环中新的K个聚类中心;

步骤3.4:重复3.2至3.3,直至满足预先设置的迭代次数或者聚类中心不再发生变化。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710157632.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top