[发明专利]一种针对聚类设计的密度估计方法和装置有效

专利信息
申请号: 202111381288.8 申请日: 2021-11-20
公开(公告)号: CN113822378B 公开(公告)日: 2022-05-27
发明(设计)人: 陈冲;申晨;黄建强;华先胜 申请(专利权)人: 阿里巴巴达摩院(杭州)科技有限公司
主分类号: G06V10/762 分类号: G06V10/762;G06V10/74;G06K9/62
代理公司: 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 代理人: 冯德魁;张艳梅
地址: 311100 浙江省杭州市余杭*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 针对 设计 密度 估计 方法 装置
【说明书】:

本申请提供一种针对聚类设计的密度估计方法,所述针对聚类设计的密度估计方法,包括:根据待聚类对象的特征构建不同待聚类对象之间相似性;对所述不同待聚类对象之间的相似性进行归一化处理,获得所述不同待聚类对象之间的转移概率矩阵;基于所述转移概率矩阵构造密度扩散,通过对所述密度扩散的迭代得到每个待聚类对象的密度。该方法首先对不同待聚类对象之间的相似性进行归一化处理,使每个待聚类对象对其他待聚类对象的密度的贡献值相同,之后,基于密度扩散的方式来估计各个待聚类对象密度的平稳分布,从而得到每个待聚类对象的密度,该方案利用了每个待聚类对象的局部特性,显著提高了不同类别的待聚类对象密度估计的稳定性和准确性。

技术领域

本申请涉及聚类分析领域,具体涉及一种针对聚类设计的密度估计算法和装置,本申请同时涉及一种电子设备及计算机存储介质。

背景技术

基于密度的聚类方法被广泛应用于各种领域,例如:视觉归档、社会网络分析等。

聚类方法具体用于将相似度高的数据点进行归档,以便快速根据归档结果对数据点进行分析,例如,在视觉归档中,可以通常通过聚类的方式将同一人的照片划分到同一类别中,以便于根据所述类别对人物进行关联推理。

然而,对于数据量庞大、类别较多的情况,由于数据点的特征通常分布在高维的流形表面中,难以准确的对各种数据点进行聚类。

现有技术中,为解决大规模数据的聚类方法主要有kmeans聚类算法和基于图卷积神经网络的算法。

对于kmeans聚类算法,此种聚类方式可以在大规模数据下高效实现,但实施该种算法需要预先了解待聚类对象的类别,以及各个类别中待聚类对象的个数据,且倾向于每个类中待聚类对象分布均匀的情况。

而对于基于图卷积神经网络的算法,此种聚类方式虽然大大提高了聚类的准确率和召回率,但在处理每个待聚类对象数据集时都需需要对卷积神经网络进行重新训练,并且在进行聚类推理的过程中需依赖图形处理器(Graphics Processing Unit,GPU),因此,此种聚类方式的整体迁移能力和聚类效率都比较低。

为解决上述两种聚类方式中的问题,现有技术中还有基于密度的聚类算法,该种算法具有非参数化、无需了解待聚类对象类别个数据、且能够发现任意形状的类别的优势。此种方法在对待聚类对象的密度估计过程中,需要以待聚类对象为中心做一个等半径的球,将球里的包含的所有待聚类对象的个数当做该待聚类对象的密度。

请参考图1a,其为本申请背景技术提供的基于密度的聚类算法获得的密度分布示意图。图1a中包括类别为○的待聚类对象组成的集群1、类别为×的待聚类对象组成的集群2、类别为△的待聚类对象组成的集群3,基于图1a的左侧图像可知,类别为○的待聚类对象的待聚类对象的个数据较多且分布相对集中,类别为×的待聚类对象数量较少,类别为△的待聚类对象分布较为稀疏,基于现有的密度计算方法计算而来的密度数据只能发现类别为○的待聚类对象的密度峰值(请参考图1a中右侧图像),而无法发现类别为×和△的待聚类对象的密度峰值。

因此,如何解决上述密度估计的问题成为本领域技术人员亟需解决的技术问题。

发明内容

本申请提供一种针对聚类设计的密度估计方法和装置,以解决上述技术问题。

本申请提供的针对聚类设计的密度方法包括:

根据待聚类对象的特征构建不同待聚类对象之间相似性;

对所述不同待聚类对象之间的相似性进行归一化处理,获得所述不同待聚类对象之间的转移概率矩阵;

基于所述转移概率矩阵构造密度扩散,通过对所述密度扩散的迭代得到每个待聚类对象的密度。

可选的,所述根据待聚类对象的特征,构建不同待聚类对象之间的相似性,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴达摩院(杭州)科技有限公司,未经阿里巴巴达摩院(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111381288.8/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top