[发明专利]一种聚类结果评价方法和系统有效

专利信息
申请号: 201910865139.5 申请日: 2019-09-12
公开(公告)号: CN110580510B 公开(公告)日: 2023-07-25
发明(设计)人: 何俊豪;蔡振伟;朱金华;王赟;裴卫斌 申请(专利权)人: 深圳力维智联技术有限公司;南京中兴力维软件有限公司
主分类号: G06F18/2321 分类号: G06F18/2321;G06F18/2411;G06F18/25
代理公司: 深圳鼎合诚知识产权代理有限公司 44281 代理人: 任葵;彭家恩
地址: 518057 广东省深圳市南*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 结果 评价 方法 系统
【说明书】:

本申请公开了一种聚类结果评价方法,包括:提取目标的特征,该特征的数据量为M;对特征进行聚类处理,得到聚类簇C={Csubgt;1/subgt;,Csubgt;2/subgt;,…,Csubgt;K/subgt;},其中K为正整数;统计聚类簇C中的纯净簇总数Csubgt;P/subgt;,其中P为正整数且0≤P≤K;计算理想聚类簇数Csubgt;I/subgt;;计算数据融合率修正系数η,其中计算聚类评价指标HI,其中本申请还公开了一种聚类结果评价系统。在本申请所涉及的方法和系统中,通过统计纯净簇总数和理想聚类簇数,并因此计算数据融合率修正系数,能快速地获得聚类评价指标,该指标客观有效地反映了聚类结果的准确性。

技术领域

本申请涉及模式识别领域,尤其涉及一种聚类结果评价方法和系统。

背景技术

聚类算法是机器学习中一种重要的算法。其属于无监督学习,主要用来分析数据的内在特点,寻找数据的分布规律,或者作为数据的预处理过程以支持数据的进一步处理。在具体的应用当中,例如人脸图像聚类算法中,根据人脸特征相似度将相似的人脸划分成同一类簇,理想情况下可以将同一个人所有图像聚为一类,在人脸特征融合、加速人脸比对检索以及目标布控、轨迹追踪等领域有着重要的作用。

在聚类中,由于“噪声”等因素的影响,存在误分类的情况,例如在实际的人脸聚类场景中由于光照、拍摄角度以及图像清晰度等因素的影响,会出现将不是同一人的人脸图像归为一簇的误分类,这会影响聚类的精度及后续的应用。因此需要对聚类结果进行评价,了解其精度以指导后续应用。但实际应用中,因为各种各样的原因,导致精确性无法直接通过计算得出,例如人脸图像大多是无标签数据,无法直接计算精确性,目前常用的聚类有效性指标如DB指数(Davies-Bouldin index,戴维森堡丁指数)、Duun指数(Duun index,邓恩指数)等都不太适用于人脸聚类的真实场景,缺乏一种能够适用于真实人脸聚类这一类无标签数据场景的聚类结果准确性的评价方法,因此需要改进和提高。

发明内容

本申请要解决的技术问题是针对现有技术的不足,提供一种快速客观的聚类结果评价方法和系统。

本申请要解决的技术问题通过以下技术方案加以解决:

本申请的第一方面提供一种聚类结果评价方法,包括:提取目标的特征,该特征的数据量为M;对特征进行聚类处理,得到聚类簇C={C1,C2,…,CK},,其中K为正整数;统计聚类簇C中的纯净簇总数CP,其中P为正整数且0≤P≤K;计算理想聚类簇数CI;计算数据融合率修正系数η,其中计算聚类评价指标HI,其中

在本申请所涉及的方法中,通过统计纯净簇总数和理想聚类簇数,并因此计算数据融合率修正系数,能快速地获得聚类评价指标,该指标客观有效地反映了聚类结果的准确性。引入数据融合率修正系数η可有效减轻阈值设定过高时聚类簇数过多,聚类精确率反而较高(聚类簇中只有一条数据,精确率为100%)从而使得精确率不适于衡量聚类效果的情况。

在本申请所涉及的方法中,其中统计所述聚类簇C中的纯净簇总数CP,包括:将聚类簇中的任一簇Ci的特征矩阵Fi与特征矩阵Fi的转置矩阵FiT相乘获得上三角矩阵Ui,特征Fi具有N个特征向量;将矩阵Ui中每一个元素与相似度阈值比较,若大于相似度阈值则赋值1,否则则赋值0,获得矩阵Ui′;对矩阵Ui′中的元素,统计下标含n的所有矩阵元素之和s,其中,n取值范围从0到N-1;若存在n使得s小于N-2则认为Ci为非纯净簇;否则,Ci为纯净簇。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳力维智联技术有限公司;南京中兴力维软件有限公司,未经深圳力维智联技术有限公司;南京中兴力维软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910865139.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top