[发明专利]一种基于普利姆的K均值聚类方法无效
申请号: | 201310343107.1 | 申请日: | 2013-08-08 |
公开(公告)号: | CN103440275A | 公开(公告)日: | 2013-12-11 |
发明(设计)人: | 王堃;徐雳雳;高会;孙雁飞;郭篁;陆恒;张玉华;叶真璋 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 叶连生 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明是一种基于普利姆的K均值聚类方法,针对K均值聚类算法随机选取中心的不足的问题,引入prim最小生成树方法对K均值聚类算法初始中心的选取进行优化,由此设计出一种改进的K均值聚类算法。使用prim最小生成树方法对随机生成的点求其最小生成树,然后从中找出最小生成树权值和最大,且权值相差不大的点集作为初始聚类中心,最后使用K均值聚类算法聚类。仿真结果表明相比传统K均值算法,本发明的方法具有更高的准确率以及更少的数据迭代次数。 | ||
搜索关键词: | 一种 基于 普利姆 均值 方法 | ||
【主权项】:
一种基于普利姆的K均值聚类方法,其特征在于使用普利姆prim最小生成树方法对随机生成的点求其最小生成树,然后从中找出具有最大权值和且权值相差不大的点集作为初始聚类中心,最后使用K均值聚类算法聚类,其步骤如下:1)随机从样本中选择k个数据对象,重复操作m次,对每一次选取的k个数据对象,使用prim求出其最小生成树,重复计算m次,对每次的最小生成树将其权值相加得到最小生成树的权值和,记第i次得到的最小生成树权值和记为dsumi,重复计算m次得到m个和,分别为dsum1,dsum2,…dsumm;其中,k为数据对象个数,m为重复计算次数,i为计算次数;2)求出最小生成树权值和中的最大值MAX(dsum1,dsum2…dsumm)对应的k个数据对象对应的点集;3)若这个k个数据对象对应的点集生成树中的权值相差不大,则将求出的点集作为初始聚类中心,转步骤4);否则去掉当前所选最小生成树权值和最大值,转步骤2);4)根据数据对象距离计算公式,求出各个数据对象到这个初始聚类中心的距离,取最小的距离放入对应的簇中,根据数据集合聚类簇中心计算公式更新簇中心;计算误差平方和函数E跟前一次的E值比较,若绝对值小于等于规定值,转步骤5),否则继续计算聚类中心;5)输出聚类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310343107.1/,转载请声明来源钻瓜专利网。