[发明专利]一种基于共享近邻的约束谱聚类方法在审
申请号: | 201810342609.5 | 申请日: | 2018-04-17 |
公开(公告)号: | CN108596234A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 丁世飞;王小玉 | 申请(专利权)人: | 中国矿业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 221116 江苏省徐州市铜山*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于共享近邻的约束谱聚类方法,所要解决的问题是原约束谱聚类算法无法很好的处理密度分布不均的数据集。同时提高原算法在数据集上的聚类准确率。本发明包括以下步骤:1.计算样本对之间的欧氏距离,根据样本对的距离矩阵,求出数据对之间的共享近邻矩阵;2.根据样本对之间的欧氏距离和共享近邻矩阵计算相似矩阵;3.通过计算各行或各列的相似值之和,求出度矩阵;4.根据步骤2和步骤3求出的相似矩阵和度矩阵构造拉普拉斯矩阵;5.根据主动查询策略得出下一项要查询的约束项,并得出约束矩阵;6.由步骤4和步骤5算得的拉普拉斯矩阵和约束矩阵就可以算出我们的聚类分配向量,得出聚类结果;该方法不仅能够有效提高约束谱聚类算法的鲁棒性,很好地处理不同密度的数据集,并能有效的避免尺度参数敏感问题,具有很好的聚类效果。 | ||
搜索关键词: | 矩阵 约束谱聚类 数据集 聚类 算法 样本 共享 欧氏距离 相似矩阵 约束矩阵 尺度参数 矩阵构造 矩阵计算 聚类结果 距离矩阵 密度分布 敏感问题 主动查询 鲁棒性 约束项 准确率 出度 向量 查询 分配 | ||
【主权项】:
1.一种基于共享近邻的约束谱聚类方法,其特征在于,利用共享近邻算法克服数据集密度分布不均缺点,然后基于约束谱聚类算法对数据进行初始聚类,再根据主动查询策略来确定下一步要查询的样本对,计算出约束矩阵,得出聚类结果,该方法具体包括:步骤1:构造距离矩阵dij,根据样本对的距离矩阵,求出数据对之间的共享近邻矩阵SNN(xi,xj);步骤2:根据公式
计算相似矩阵wij;步骤3:利用
计算度矩阵;步骤4:根据上述求出的相似矩阵wij和度矩阵di,利用公式
计算数据集规范化拉普拉斯矩阵
步骤5:根据主动查询策略得出下一项要查询的约束项,并得出约束矩阵Q;步骤6:利用公式
计算出它的规范化约束矩阵
步骤7:根据步骤4和步骤6求出的规范化拉普拉斯矩阵
和规范化约束矩阵
利用
和u=D‑1/2v得出聚类结果u。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学,未经中国矿业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810342609.5/,转载请声明来源钻瓜专利网。