[发明专利]聚类效果测评方法、系统、介质及装置在审
申请号: | 202110292980.7 | 申请日: | 2021-03-18 |
公开(公告)号: | CN113011742A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 尹文科;万珺;游宇;杨朔;戴海峰;李仁最;何洪路;张迪;马楷 | 申请(专利权)人: | 恒睿(重庆)人工智能技术研究院有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F17/16;G06K9/62 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 王文凯;宋宝库 |
地址: | 401121 重庆市渝北*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 效果 测评 方法 系统 介质 装置 | ||
1.一种聚类效果测评方法,其特征在于,所述测评方法包括:
获取含有标注信息的待聚类的所有数据样本的总量,所述标注信息包括各数据样本的真实类别名;
计算各预测分类组中不同标注信息对应的数据样本的数量,所述预测分类组是聚类系统对所述待聚类的所有数据样本进行聚类后得到;
基于各所述预测分类组中不同标注信息对应的数据样本的数量确定各预测分类组的预测类别名;
计算已确定的各预测类别名对应的预测分类组中数据样本的总量并将其确定为关联的数据样本的总量,以及计算各预测分类组中真实类别名与预测类别名相同的数据样本的总量并将其确定为正确关联的数据样本的总量;
基于待聚类的所有数据样本的总量、关联的数据样本的总量以及正确关联的数据样本的总量,利用混淆矩阵来计算针对所述聚类系统的聚类效果评价指标。
2.根据权利要求1所述的测评方法,其特征在于,“基于各所述预测分类组中不同标注信息对应的数据样本的数量确定各预测分类组的预测类别名”的步骤包括:
对于一个预测分类组,将其中数据样本的数量最多的真实类别名确定为该预测分类组的预测类别名;或者,对于一个真实类别名,将其对应的数据样本的数量最多的预测分类组的预测类别名确定为该真实类别名;以及,
将无法确定预测类别名的预测分类组均确定为未知类别名;
其中,所有预测分类组的预测类别名均不相同。
3.根据权利要求1所述的测评方法,其特征在于,所述含有标注信息的所有数据样本均为人像样本,所述标注信息还包括各人像样本中是否含有人脸;“基于各所述预测分类组中不同标注信息对应的数据样本的数量确定各预测分类组的预测类别名”的步骤还包括:
计算各所述预测分类组中真实类别名对应的有人脸的数据样本的数量;
对于一个预测分类组,将其中有人脸的数据样本的数量最多的真实类别名作为该预测分类组的预测类别名;或者,对于一个真实类别名,将其对应的有人脸的数据样本的数量最多的预测分类组的预测类别名确定为该真实类别名;以及,
将无法确定预测类别名的预测分类组均确定为未知类别名;
其中,所有预测分类组的预测类别名均不相同。
4.根据权利要求1所述的测评方法,其特征在于,所述含有标注信息的所有数据样本均为人像样本,所述标注信息还包括各人像样本中是否含有人脸;所述测评方法还包括:在“基于待聚类的所有数据样本的总量、关联的数据样本的总量以及正确关联的数据样本的总量,利用混淆矩阵来计算针对所述聚类系统的聚类效果评价指标”的步骤之前,
针对含有标注信息的所有数据样本、有人脸的所有数据样本和无人脸的所有数据样本中的任一种:计算待聚类的所有数据样本的总量、关联的数据样本的总量以及正确关联的数据样本的总量。
5.根据权利要求4所述的测评方法,其特征在于,“基于待聚类的所有数据样本的总量、关联的数据样本的总量以及正确关联的数据样本的总量,利用混淆矩阵来计算针对所述聚类系统的聚类效果评价指标”的步骤包括:
计算数据样本聚类的关联率:
计算数据样本聚类的精确率:
计算数据样本聚类的综合准确率:
然后,将Acc、P和Acc*P中的一个或者多个作为所述聚类效果评价指标;
其中,针对含有标注信息的所有数据样本、有人脸的所有数据样本和无人脸的所有数据样本中的任一种:TP+FP+FN+TN表示待聚类的所有数据样本的总量,TP+FP表示关联的数据样本的总量,TP表示正确关联的数据样本的总量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恒睿(重庆)人工智能技术研究院有限公司,未经恒睿(重庆)人工智能技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110292980.7/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理