[发明专利]基于三元组的自动估计类数的子空间聚类方法在审
申请号: | 201810170826.0 | 申请日: | 2018-03-01 |
公开(公告)号: | CN108345910A | 公开(公告)日: | 2018-07-31 |
发明(设计)人: | 杨巨峰;程明明;梁杰;王恺 | 申请(专利权)人: | 南开大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 天津耀达律师事务所 12223 | 代理人: | 张耀 |
地址: | 300500 天津*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类 样本 三元组 高维数据 子空间 矩阵 计算机视觉 预处理步骤 二元关系 辅助措施 划分系统 模式识别 优化问题 传统的 数据集 低维 类簇 鲁棒 衡量 缓解 | ||
1.一种基于三元组的自动估计类数的子空间聚类方法,其特征在于,该方法包含如下步骤:
a.用户输入待聚类的样本数据集,输入到本系统中,系统首先解决一个自表示的优化问题,得到包含样本对相关关系的系数矩阵;
b.系统根据得到的各样本对之间的相关关系,计算出更加鲁棒的样本间的三元组关系,以此获得样本间更加丰富的相关性信息;
c.利用计算出的样本间的三元组关系,同时优化基于模型选择奖励和样本融合奖励的目标函数,其中,优化模型选择奖励可以准确地估计出聚类类数,样本融合奖励可以高效地将各个样本划分到各个类中。
2.根据权利要求1所述的基于三元组的自动估计类数的子空间聚类方法,其特征在于:通过求解基于损失项与二范数正则项的自表示的优化问题,求解得到各样本与其他样本的相关关系,以此为基础找到每个样本的近邻。
3.根据权利要求1所述的基于三元组的自动估计类数的子空间聚类方法,其特征在于:三元组关系是由样本内部的相关关系得到的,即当三个样本两两互为近邻时,判定该三个样本为一个三元组,其可以对判断样本的类簇归属产生较强的自我约束作用,同时,高维的相关关系也可以使本发明对类簇边界处的样本更加鲁棒。
4.根据权利要求1所述的基于三元组的自动估计类数的子空间聚类方法,其特征在于:模型选择奖励的计算主要依赖于三元组与现有聚类簇之间的关系及类簇的密度,在某次迭代过程中,当某三元组与现有所有聚类簇均无交集时,则认为现有的簇是不完备的,需要继续扩充。
5.根据权利要求1所述的基于三元组的自动估计类数的子空间聚类方法,其特征在于:样本融合奖励主要依赖于样本与已得到的聚类中心的相关性,每个样本划分到的类簇满足以下条件:类簇中包含该样本的三元组的数量比其他类簇多。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810170826.0/1.html,转载请声明来源钻瓜专利网。