[发明专利]一种基于最小生成树与初始聚类中心的聚类算法在审
申请号: | 201711277329.2 | 申请日: | 2017-12-06 |
公开(公告)号: | CN107766897A | 公开(公告)日: | 2018-03-06 |
发明(设计)人: | 马燕;吕晓波;李顺宝;黄慧;张玉萍 | 申请(专利权)人: | 上海师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 上海精晟知识产权代理有限公司31253 | 代理人: | 冯子玲 |
地址: | 200234 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 最小 生成 初始 中心 算法 | ||
1.一种基于最小生成树与初始聚类中心的聚类算法,其特征在于,包括以下步骤:
S1:输入待聚类的数据集D及类别数K;
S2:构造所述数据集D的最小生成树TD,并计算所述最小生成树TD中任意两个节点间的测地距离;
S3:选取初始聚类中心;
S4:构造所述初始聚类中心的最小生成树Ti;
S5:断开数据集的所述最小生成树TD的K-1条边。
2.如权利要求1所述的一种基于最小生成树与初始聚类中心的聚类算法,其特征在于,所述输入待聚类的数据集D及类别数K的具体步骤为:输入待聚类为K个类别的数据集D,所述数据集D共有n个数据点di,D={di|i=1,2,…,n}。
3.如权利要求1所述的一种基于最小生成树与初始聚类中心的聚类算法,其特征在于,所述的构造所述数据集D的最小生成树TD,并计算所述最小生成树TD中任意两个节点间的测地距离的具体步骤为:
首先,利用PRIM算法对数据集D={di|i=1,2,…,n}构造最小生成树TD={vi|i=1,2,…,n},数据点di与节点vi是一一对应关系,相邻两节点vi与vj构成的边的权重等于对应数据点di与dj之间的欧几里德距离;
其次,对于TD内任意两节点vi与vj之间存在唯一的一条路径vi→vj,节点vi与节点vj之间的测地距离gij等于路径vi→vj上所有边的权重之和。
4.如权利要求1所述的一种基于最小生成树与初始聚类中心的聚类算法,其特征在于,所述的选取初始聚类中心的具体步骤为:首先,根据测地距离gij求出任意节点vi的高斯密度ρi:
其中,σ为标准差,σ取值方法是:对测地距离gij按从小到大进行排序,取排在第个的测地距离作为σ的数值,这里表示向下取整;
其次,按照下述公式计算节点vi与所有比其密度大的节点之间测地距离的最小值δi:
δi=min(gij|j=1,2,…,n,ρi<ρj)
然后,计算节点vi的密度ρi与δi的乘积γi,对所有的节点按γi从大到小排序;
最后,取前K个γi对应的节点作为初始聚类中心C,其中C={ci,i=1,2,…,K}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海师范大学,未经上海师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711277329.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于色相聚类的光谱降维方法
- 下一篇:基于SVM的三分类情绪概率判断方法