[发明专利]融合成对约束和规模约束的半监督聚类方法在审
申请号: | 201810236079.6 | 申请日: | 2018-03-21 |
公开(公告)号: | CN108446736A | 公开(公告)日: | 2018-08-24 |
发明(设计)人: | 罗森林;王海州;潘丽敏;韩龙飞 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种融合成对约束和规模约束的半监督聚类方法,属于计算机与信息科学技术领域。该方法包括:随机从少量样本标签数据选择样本对生成约束对,采用并查集方法扩展约束对;使用加权KKZ算法初始化聚类质心,避免选择噪声或异常数据作为初始化质心;更新高斯混合模型的目标函数,将不同监督信息作为不同参数的惩罚项,实现多目标监督信息整合。由于本发明提供的半监督聚类方法将多目标监督信息融合至半监督聚类,既提升了聚类的准确性,又避免了产生空类或仅包含少量样本的无效类别。 | ||
搜索关键词: | 半监督聚类 样本 成对约束 多目标 高斯混合模型 信息科学技术 算法初始化 标签数据 聚类质心 目标函数 信息融合 信息整合 异常数据 融合 惩罚项 初始化 监督 聚类 质心 加权 噪声 计算机 更新 | ||
【主权项】:
1.融合成对约束和规模约束的半监督聚类方法,其特征在于所述方法包括如下步骤:步骤1,假设随机从数据集D中选择两个样本(xi,yi)和(xj,yj),如果yi=yj,则将两样本加入Must‑link约束对集合M中;如果yi≠yj,则将两样本加入Cannot‑link约束对集合C中,按照如上规则,随机选择一定数量样本,构建约束对集合;步骤2,使用并查集方法扩展约束对;步骤3,使用加权KKZ方法进行聚类质心的初始化,利用噪声数据的高斯概率密度函数值必然很小或者倾向于等于0的特性,将任意样本的高斯概率密度作为样本的权重加入KKZ的最大‑最小化距离计算公式中,一定程度上缓解噪声选择问题,同时对于非噪声数据不产生影响;步骤4,进行多目标信息整合,利用EM算法优化参数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810236079.6/,转载请声明来源钻瓜专利网。