[发明专利]数据处理方法及装置、处理器、电子设备、存储介质在审
申请号: | 201911392303.1 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111160463A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 何悦;黄厚钧;李诚;王贵杰;王子彬 | 申请(专利权)人: | 深圳市商汤科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;董文俊 |
地址: | 518054 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 处理器 电子设备 存储 介质 | ||
本申请公开了一种数据处理方法及装置、处理器、电子设备、存储介质。该方法包括:获取第一簇和第二簇;将所述第一簇中的点与所述第二簇中的点作为待确认点对,在所述待确认点对中的两个点之间的第一相似度大于或等于第一阈值的情况下,确定所述待确认点对为支持合并点对;依据所述支持合并点对的数量和所述待确认点对的数量得到第一值;依据所述第一值合并所述第一簇和所述第二簇。
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据处理方法及装置、处理器、电子设备、存储介质。
背景技术
聚类分析是数据挖掘和机器学习等领域的关键技术之一。聚类分析通过将数据集中的相似样本点汇聚至同一类簇,使不同类簇的样本点之间具有尽量小的视觉、模式识别等多个方面。目前的聚类分析技术主要包括划分聚类、合并聚类、基于密度聚类、网格聚类、谱聚类等几种。合并聚类因其概念简单、易于解释、聚类结果层次化和结构化明显等特点被广泛应用于各种领域。
发明内容
本申请提供一种数据处理方法及装置、处理器、电子设备、存储介质。
第一方面,提供了一种数据处理方法,所述方法包括:
获取第一簇和第二簇;所述第一簇中的点的类别相同,所述第二簇中的点的类别相同,且所述第一簇中的点的类别与所述第二簇中的点的类别不同;
将所述第一簇中的点与所述第二簇中的点组成待确认点对,在所述待确认点对中的两个点之间的第一相似度大于或等于第一阈值的情况下,确定所述待确认点对为支持合并点对;
依据所述支持合并点对的数量和所述待确认点对的数量得到第一值;
依据所述第一值合并所述第一簇和所述第二簇。
该方面通过将第一簇中的一个点和第二簇的一个点作为一个待确认点对,并依据待确认点对中的两个点之间的相似度确定待确认点对是否为支持合并点对。若待确认点对中支持合并点对的占比达到合并预设值,表征第一簇中的点与第二簇中的点之间的相似度高,进而执行合并第一簇和第二簇的操作,可提高合并第一簇和第二簇的准确率。
结合本申请任一实施方式,在所述将所述第一簇中的点与所述第二簇中的点作为待确认点对,在所述待确认点对中的两个点之间的第一相似度大于或等于第一阈值的情况下,确定所述待确认点对为支持合并点对之前,所述方法还包括:
确定所述第一簇中的第一点与所述第一簇中的第二点之间的第二相似度;
依据所述第二相似度,得到所述第一阈值;所述第一阈值与所述第二相似度呈正相关。
在该实施方式中,依据第一簇中的点之间的相似度确定第一阈值,可实现为不同种类的数据设置不同的第一阈值,进而提升合并准确率。
结合本申请任一实施方式,所述依据所述第一值合并所述第一簇和所述第二簇,包括:
在所述第一值大于或等于第二阈值的情况下,合并所述第一簇和所述第二簇。
结合本申请任一实施方式,所述在所述第一值大于或等于第二阈值的情况下,合并所述第一簇和所述第二簇之前,所述方法还包括:
在所述第一相似度小于或等于第三阈值的情况下,确定所述待确认点对为支持不合并点对;
依据所述支持不合并点对的数量与所述待确认点对的数量,得到第二值;
所述在所述第一值大于或等于第二阈值的情况下,合并所述第一簇和所述第二簇,包括:
在所述第一值大于或等于所述第二阈值的情况下,依据所述第二值合并所述第一簇和所述第二簇。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市商汤科技有限公司,未经深圳市商汤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911392303.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:针推康科研数据管理系统
- 下一篇:一种信息处理方法及系统