[发明专利]基于Self-tuning的局部密度谱聚类相似度量算法在审
申请号: | 201410498330.8 | 申请日: | 2014-09-25 |
公开(公告)号: | CN104318241A | 公开(公告)日: | 2015-01-28 |
发明(设计)人: | 陈雷霆;蔡洪斌;邱航;关亚勇;曹跃;崔金钟;卢光辉 | 申请(专利权)人: | 东莞电子科技大学电子信息工程研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 成都中亚专利代理有限公司 51126 | 代理人: | 何渊 |
地址: | 523010 广东省东莞市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 self tuning 局部 密度 谱聚类 相似 度量 算法 | ||
技术领域
本发明数据聚类分析技术领域,具体涉及一种基于Self-tuning的局部密度谱聚类相似度量算法,可用于对数据、图片等信息进行聚类分析。
背景技术
聚类分析是一种重要的无监督分析方法,谱聚类则是一种新的聚类方法,基于谱聚类好的聚类效果和完善的理论推导,已被广泛的应用到数据聚类分析问题中。传统的聚类算法,如k-means算法,GMM算法等适用于凸球形的样本空间,对于样本空间为非凸时,算法会陷入局部最优,但谱聚类方法能够很好地收敛到全局最优,且在没有对数据的原始结构做任何假设的情况下,无论对于常规的密集型数据,还是一些任意结构的数据,谱聚类都能够表现出很好的聚类效果。
谱聚类方法主要将数据的聚类问题转化为图谱的分割问题,进而对数据进行划分。在谱聚类算法中,关键的处理部分主要有三个:相似性度量的方法选取、拉普拉斯矩阵的构建和特征向量的选取。其中拉普拉斯矩阵的构建是直接基于相似矩阵进行操作的,相似矩阵的好坏直接影响到最后的聚类效果,所以如何进行相似性度量一直是谱聚类方法中备受研究的一个话题。
原始的谱聚类方法提出来的相似性度量是采用高斯核的方法进行构建,但其参数σ需要根据数据的实际规模来设定,不同的σ值会产生不同的聚类效果,波动较大,很难找到一个最优的值。Lihi Zelnik.Manor等人提出的Self-Tuning Spectral Clustering方法利用局部尺度参数来代替全局的尺度参数,该方法能够很好的应对多尺度的数据,但其构造的相似矩阵不能够表示出数据点之间的局部密度信息,导致在一些真实数据集上不能达到理想的聚类效果;XianchaoZhang等人中提出了基于公共近邻的方法来反映两个数据点之间的局部密度,并且通过全局的σ参数来表示数据之间的粘连效果,但该方法需要手工设定参数σ来反映数据的结构规模,波动较大,且公共近邻半径选取意义不明确,导致在一些结构复杂的数据集上不能够达到聚类的效果。
发明内容
基于以上方法的思想和存在问题,我们提出了一种改进的谱聚类方法即基于Self-tuning的局部密度谱聚类相似度量算法,主要解决了两个方面的问题:(1).自适应的计算尺度参数σ,不需要手工设定参数的值;(2).自适应的计算样本数据的局部密度,增强属于同一聚类的数据点之间的权重值。
在基于Self-tuning的局部密度谱聚类相似度量算法(以下简称SC-STLD算法)中,相似矩阵的构造公式如下:
σi=d(xi,xk)(2)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞电子科技大学电子信息工程研究院,未经东莞电子科技大学电子信息工程研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410498330.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:太阳能板模块和组件
- 下一篇:一种基于计算机视觉的花蕾判别方法