[发明专利]一种基于最小生成树与初始聚类中心的聚类算法在审

专利信息
申请号: 201711277329.2 申请日: 2017-12-06
公开(公告)号: CN107766897A 公开(公告)日: 2018-03-06
发明(设计)人: 马燕;吕晓波;李顺宝;黄慧;张玉萍 申请(专利权)人: 上海师范大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 上海精晟知识产权代理有限公司31253 代理人: 冯子玲
地址: 200234 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 最小 生成 初始 中心 算法
【权利要求书】:

1.一种基于最小生成树与初始聚类中心的聚类算法,其特征在于,包括以下步骤:

S1:输入待聚类的数据集D及类别数K;

S2:构造所述数据集D的最小生成树TD,并计算所述最小生成树TD中任意两个节点间的测地距离;

S3:选取初始聚类中心;

S4:构造所述初始聚类中心的最小生成树Ti

S5:断开数据集的所述最小生成树TD的K-1条边。

2.如权利要求1所述的一种基于最小生成树与初始聚类中心的聚类算法,其特征在于,所述输入待聚类的数据集D及类别数K的具体步骤为:输入待聚类为K个类别的数据集D,所述数据集D共有n个数据点di,D={di|i=1,2,…,n}。

3.如权利要求1所述的一种基于最小生成树与初始聚类中心的聚类算法,其特征在于,所述的构造所述数据集D的最小生成树TD,并计算所述最小生成树TD中任意两个节点间的测地距离的具体步骤为:

首先,利用PRIM算法对数据集D={di|i=1,2,…,n}构造最小生成树TD={vi|i=1,2,…,n},数据点di与节点vi是一一对应关系,相邻两节点vi与vj构成的边的权重等于对应数据点di与dj之间的欧几里德距离;

其次,对于TD内任意两节点vi与vj之间存在唯一的一条路径vi→vj,节点vi与节点vj之间的测地距离gij等于路径vi→vj上所有边的权重之和。

4.如权利要求1所述的一种基于最小生成树与初始聚类中心的聚类算法,其特征在于,所述的选取初始聚类中心的具体步骤为:首先,根据测地距离gij求出任意节点vi的高斯密度ρi

ρi=Σj=1,j≠inexp(-gij22σ2)]]>

其中,σ为标准差,σ取值方法是:对测地距离gij按从小到大进行排序,取排在第个的测地距离作为σ的数值,这里表示向下取整;

其次,按照下述公式计算节点vi与所有比其密度大的节点之间测地距离的最小值δi

δi=min(gij|j=1,2,…,n,ρi<ρj)

然后,计算节点vi的密度ρi与δi的乘积γi,对所有的节点按γi从大到小排序;

最后,取前K个γi对应的节点作为初始聚类中心C,其中C={ci,i=1,2,…,K}。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海师范大学,未经上海师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711277329.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top