[发明专利]一种基于共享近邻的约束谱聚类方法在审

专利信息
申请号: 201810342609.5 申请日: 2018-04-17
公开(公告)号: CN108596234A 公开(公告)日: 2018-09-28
发明(设计)人: 丁世飞;王小玉 申请(专利权)人: 中国矿业大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 221116 江苏省徐州市铜山*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出一种基于共享近邻的约束谱聚类方法,所要解决的问题是原约束谱聚类算法无法很好的处理密度分布不均的数据集。同时提高原算法在数据集上的聚类准确率。本发明包括以下步骤:1.计算样本对之间的欧氏距离,根据样本对的距离矩阵,求出数据对之间的共享近邻矩阵;2.根据样本对之间的欧氏距离和共享近邻矩阵计算相似矩阵;3.通过计算各行或各列的相似值之和,求出度矩阵;4.根据步骤2和步骤3求出的相似矩阵和度矩阵构造拉普拉斯矩阵;5.根据主动查询策略得出下一项要查询的约束项,并得出约束矩阵;6.由步骤4和步骤5算得的拉普拉斯矩阵和约束矩阵就可以算出我们的聚类分配向量,得出聚类结果;该方法不仅能够有效提高约束谱聚类算法的鲁棒性,很好地处理不同密度的数据集,并能有效的避免尺度参数敏感问题,具有很好的聚类效果。
搜索关键词: 矩阵 约束谱聚类 数据集 聚类 算法 样本 共享 欧氏距离 相似矩阵 约束矩阵 尺度参数 矩阵构造 矩阵计算 聚类结果 距离矩阵 密度分布 敏感问题 主动查询 鲁棒性 约束项 准确率 出度 向量 查询 分配
【主权项】:
1.一种基于共享近邻的约束谱聚类方法,其特征在于,利用共享近邻算法克服数据集密度分布不均缺点,然后基于约束谱聚类算法对数据进行初始聚类,再根据主动查询策略来确定下一步要查询的样本对,计算出约束矩阵,得出聚类结果,该方法具体包括:步骤1:构造距离矩阵dij,根据样本对的距离矩阵,求出数据对之间的共享近邻矩阵SNN(xi,xj);步骤2:根据公式计算相似矩阵wij;步骤3:利用计算度矩阵;步骤4:根据上述求出的相似矩阵wij和度矩阵di,利用公式计算数据集规范化拉普拉斯矩阵步骤5:根据主动查询策略得出下一项要查询的约束项,并得出约束矩阵Q;步骤6:利用公式计算出它的规范化约束矩阵步骤7:根据步骤4和步骤6求出的规范化拉普拉斯矩阵和规范化约束矩阵利用和u=D‑1/2v得出聚类结果u。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学,未经中国矿业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810342609.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top