[发明专利]一种基于KNN的密度峰值聚类方法在审

申请号：	201811617176.6	申请日：	2018-12-28
公开（公告）号：	CN109697471A	公开（公告）日：	2019-04-30
发明（设计）人：	朱庆生;姚成亮;粟铭瑶;冉谨铭;张智勇;程东东	申请（专利权）人：	重庆大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	重庆市前沿专利事务所(普通合伙) 50211	代理人：	郭云
地址：	400044 ***	国省代码：	重庆;50
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	样本点聚类集合聚类数据集中算法标记排列分配策略计算数据降序排列近邻信息邻居搜索有效解决数据集分配分类
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于KNN的密度峰值聚类方法，其特征在于，包括以下几个步骤：

S1：通过自然邻居搜索算法得到数据集中每个样本点的K值；

S2:计算数据集中每个样本点的K个近邻信息，得到第一聚类集合；

S3：计算第一聚类集合中每个样本点的密度，对密度进行降序排列，标记排列前G的密度对应的样本点为核心点，对核心点进行分类形成第二聚类集合；

S4：对数据集中所有样本点进行分配，得到第三聚类集合。

2.如权利要求1所述的一种基于KNN的密度峰值聚类方法，其特征在于，所述S1中，自然邻居搜索算法通过对K值从1递增进行计算，每次递增都会查找每个样本点的自然邻居，直到所有样本点都有自然邻居或者没有自然邻居的样本点的数量在达到预设的搜索次数后不再发生改变，算法停止。

3.如权利要求1所述的一种基于KNN的密度峰值聚类方法，其特征在于，所述S2中，包括以下步骤：

S2-1:计算每个样本点的K个近邻信息，计算公式如下：

KNN(X_i)＝{X_j|X_j∈sorted(Dist(i))(a)}； (1)

公式(1)中，KNN(X_i)表示样本点X_i的K个近邻信息，X_j表示X_i的近邻，Dist表示N*N的距离矩阵，N表示样本点的个数，Dist(i)表示样本X_i到其余样本点的距离矩阵，大小为1*N，sorted表示对距离矩阵进行升序排序，a＝1、2···K。

S2-2：计算样本点之间的共享K近邻信息，形成第一聚类集合；

共享K近邻信息SKNN(X_i，X_j)的计算公式为：

SKNN(X_i，X_j)＝KNN(X_i)∩KNN(X_j) (2)

公式(2)中，SKNN(X_i，X_j)表示样本点X_i和X_j的共享K近邻信息，KNN(X_i)表示样本点X_i的K近邻信息，KNN(X_j)表示样本点X_j的K近邻信息，∩表示交集。

4.如权利要求1所述的一种基于KNN的密度峰值聚类方法，其特征在于，所述S3中，所述样本点的密度计算公式为：

d(X_i)＝∑d(X_i,X_j)|X_j∈KNN(X_i) (4)

公式(3)、(4)、(5)中，ρ(X_i)表示样本点X_i的密度，d(X_i)表示样本点X_i与其K近邻点的距离之和，d(X_i，X_j)表示样本点X_i和X_j的欧式距离,X_j和X_i是近邻关系，m表示样本点的维数,t代表遍历m时的维数值，X_it表示样本点X_i的第t维数值。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于重庆大学，未经重庆大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811617176.6/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载