[发明专利]一种多分辨率数据聚类分析方法有效
申请号: | 202011589479.9 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112633391B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 卢建云;李士果;李腾;路亚;邵俊明;宋子豪 | 申请(专利权)人: | 重庆电子工程职业学院 |
主分类号: | G06F18/2321 | 分类号: | G06F18/2321 |
代理公司: | 北京润捷智诚知识产权代理事务所(普通合伙) 11831 | 代理人: | 安利霞 |
地址: | 401331 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分辨率 数据 聚类分析 方法 | ||
本发明涉及聚类分析技术领域,具体公开了一种多分辨率数据聚类分析方法,包括以下步骤:步骤S1,采用累积泊松概率密度函数对数据集中的数据对象的逆k最近邻数目进行度量得到动态局部密度,k为最近邻数目;步骤S2,根据动态局部密度的降排序,采用逆k最近邻扩展的方法依次遍历数据集,生成聚类结构;步骤S3,将聚类结构向量作为一维信号,利用小波变换对聚类结构进行分析,得到聚类结果,聚类结果包括类簇大小、密度变化、数据密度分布和边缘分布。采用本发明的技术方案能够解决当前的聚类分析方法聚类间断点不明确和聚类间的突变信息不能识别。
技术领域
本发明涉及聚类分析技术领域,特别涉及一种多分辨率数据聚类分析方法。
背景技术
随着人工智能的发展,数据是人工智能快速发展的核心动力之一。数据作用于人工智能的第一步是数据预处理,在人脸识别领域,人脸图像聚类时人脸数据预处理非常重要的一步,即同一个人的不同图像归到同一个类别或者标签。随着互联网的发展、监控摄像头的普及,能够获取的人脸数据越来越多,海量的人脸数据聚类需要大量的人力和物力。
目前人脸聚类的方法主要为:通过深度学习模型,把人脸图像转化为特征向量,两张人脸图片的相似度转化为两个人脸特征向量的相似度,设定一个相似度阈值,两张人脸相似度超过设定阈值,认定是同一个人。聚类时,取一张待聚类图片,跟已经聚类的所有图片一一进行比较,找到跟已分类的哪一类图像相似,将该图像归到哪一类。而在聚类的过程中,人脸特征越清晰,且人脸特征之间区别越明确,人脸图像的聚类越准确。
聚类分析又称群分析,它是研究(无标记样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的重要算法。聚类是由若干模式组成的,通常,模式是一种度量,或者是多维空间的一个点。最近30年有大量的聚类算法被提出,但是与本技术相关的各个算法都有不少的缺陷:
1.DBSCAN算法是基于密度的聚类,能发现任意形状的簇,但涉及的邻域半径和邻域内数据点数目两个参数难以设置,容易将边缘点和处于稀疏区域的点归类为噪声。
2.RNNDBSCAN算法利用逆k最近邻域遍历数据集,避免设置参数,但并没有很好解决非噪声点聚类的问题。
3.OPTICS算法提出了聚类结构,但OPTICS给出的聚类结构很难确定聚类的起始点,聚类间的间断点不明确,造成聚类结果不准确。
4.WaveCluster算法对数据点的每个维度进行小波变换,找出聚类间的突变信息,但对于边缘重叠的多个聚类,则不能识别聚类间的突变信息。
综上,采用上述聚类分析方案,存在人脸特征的聚类间断点不明确和人脸特征聚类间的突变信息不能识别,导致人脸图像聚类准确度低。
发明内容
为解决当前的人脸图像聚类分析方法存在人脸特征的聚类间断点不明确和人脸特征聚类间的突变信息不能识别,导致人脸图像聚类准确度低的技术问题,本发明提供一种多分辨率数据聚类分析方法。
本发明基础方案如下:
一种多分辨率数据聚类分析方法,包括以下步骤:
步骤S1,采用累积泊松概率密度函数对数据集中的数据对象的逆k最近邻数目进行度量得到动态局部密度,k为最近邻数目;
步骤S2,根据动态局部密度的降排序,采用逆k最近邻扩展的方法依次遍历数据集,生成聚类结构;
步骤S3,将聚类结构向量作为一维信号,利用小波变换对聚类结构进行分析,得到聚类结果,聚类结果包括类簇大小、密度变化、数据密度分布和边缘分布。
进一步,步骤S1中,数据集S,数据集S包含n个数据对象p,数据对象p的动态局部密度DLD(p)的计算模型定义为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆电子工程职业学院,未经重庆电子工程职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011589479.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置