[发明专利]一种面向多维属性数据的多层聚类融合机制的设计方法有效
申请号: | 201510362392.0 | 申请日: | 2015-06-26 |
公开(公告)号: | CN104933444B | 公开(公告)日: | 2019-01-01 |
发明(设计)人: | 叶宁;张迎亚;黄海平;沙超;王汝传 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 汪旭东 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类 灰关联度 多维属性 聚类结果 数据对象 多层 融合 预处理 粗糙集理论 归一化处理 属性重要性 参考标准 矩阵形式 决策系统 数据指标 相似矩阵 最大概率 决策表 数据集 信息熵 概率 转化 | ||
本发明公开了一种面向多维属性数据的多层聚类融合机制的设计方法,该方法包括:步骤1:将数据集转化成矩阵形式,对数据进行预处理;步骤2:根据数据指标属性特点提取最优参考标准,并对数据进行归一化处理;步骤3:计算灰关联度,生成灰关联度相似矩阵,然后进行灰关联度聚类,得到初次聚类结果;步骤4:根据上述步骤3初次聚类结果,采用粗糙集理论建立决策表系统;步骤5:对每个聚类成员计算它在该决策系统的属性重要性信息熵值;步骤6:对每个聚类成员设置权值;步骤7:根据计算的权值,采用概率方法计算每个数据对象在每个所属类级别里的概率,从中选择取值最大概率时所在的类级别,就是该数据对象所属类级别,得到最终聚类融合结果。
技术领域
本发明涉及一种面向多维属性数据的多层聚类融合机制的设计方法,属于数据挖掘技术领域。
背景技术
聚类融合技术应用于分析处理、挖掘数据,并且针对数据的不规律性性和分散性提取有用的知识。聚类融合算法是一种非监督机器学习算法,与监督学习算法不同,不要求事先了解数据集的分布。聚类算法的目的就是将数据划分成若干类,以揭示这些数据分布的真实情况。而通常一组传感器节点采集的数据一般具有多种混合属性,将多种属性的数据进行聚类融合,避免了单一属性数据处理的盲区,提高了多源信息处理质量,有利于决策分析。
在灰色理论分析中,灰关联度是研究数据之间相似度的一种度量方法,其对样本量大小和样本有无明显的分布规律没有严格要求,且计算量较小,可以根据样本数据得到数据之间的灰关联度,进而建立灰关联相似矩阵。灰色关联聚类实质上是对空间中若干点组成条曲线之间几何形态的分析与比较,一般认为曲线间几何形状越接近参考标准序列,则其与参考标准关联程度就越高,所属类别等级也越高。
粗糙集理论是一种处理不确定、不精确、含模糊信息的数学理论方法,该理论已经应用在机器学习、数据挖掘、决策分析等领域。粗糙集理论同模糊集、神经网络、证据理论等其它理论一起,成为不确定性计算的一个重要分支。当前的聚类融合算法大多不考虑聚类数据对象指标属性以及聚类成员的质量,本文提出了一种基于灰关联聚类与粗糙集理论的面向多维属性数据的加权聚类融合机制。
发明内容
本发明目的在于提供了一种一种面向多维属性数据的多层聚类融合机制的设计方法,该方法是利用灰色关联分析与粗糙集理论方面的聚类加权信息处理,来解决面向多维混合属性数据的聚类融合问题。与目前已研究出来的数据聚类相关方法不同,本发明是一种基于多种混合属性的聚类融合方法,并且考虑了数据对象的指标属性与聚类成员质量,通过使用本发明提出的方法可以在一定程度提高整体数据的聚类性能,并判别数据相对于参考标准的优劣级别。
本发明解决其技术问题所采取的技术方案是:一种面向多维属性数据的多层聚类融合机制的设计方法,该方法采用多层聚类融合的机制。根据数据的指标属性从分析域数据中提取最优参考标准,把提取的最优参考标准与数据库中已知的历史参考标准序列集分别用于计算灰关联度,然后计算灰关联相似矩阵,得到灰关联聚类结果。把聚类成员结果结合粗糙集理论,建立决策信息表,完成对聚类成员的加权融合。针对加权结果采用概率论分别计算其所属分类级别,并定义数据对象与参考标准序列关联度越高,则该对象被列的级别越高,在此规定一级类别为最高级别,二级类别、三级类别以此类推。本发明从整体上提高了聚类融合模型的可行性与可靠性,且给出了数据对象的优劣级别。
本发明是通过分析多传感器信息聚类融合各阶段的特点,首先设置阈值,过滤、删除分析域数据的异常点。基于面向多维混合属性的信息聚类融合体系结构主要包括四部分:依据指标属性提取最优参考标准、灰关联聚类分析、粗糙集理论的应用、概率统计数据级别。
本发明在无线传感器网络中,通过一组传感器节点针对某目标在同一时刻采集不同类型的信息,并对数据信息进行加工处理以提取有价值的知识。由于传感器节点感知的数据可能会出现缺失、不确定等情况,首先将采集的数据进行预处理,转化成矩阵格式,然后设置阈值,过滤、删除异常数据点。然后针对分析域数据进行灰关联聚类,再由粗糙集理论进行加权决策分析,进而采用概率论方法计算聚类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510362392.0/2.html,转载请声明来源钻瓜专利网。