[发明专利]一种不确定数据的聚类方法在审
申请号: | 201510666299.9 | 申请日: | 2015-10-16 |
公开(公告)号: | CN105260748A | 公开(公告)日: | 2016-01-20 |
发明(设计)人: | 李嘉菲;孙小玉;高滢 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 吉林长春新纪元专利代理有限责任公司 22100 | 代理人: | 白冬冬 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种不确定数据的聚类方法,属于数据采集和处理技术领域。本发明的目的是利用数据本质上的潜在关联,探寻不确定表象下底层数据记录的真实协方差结构,提取数据的主要特征,并进行降噪聚类的不确定数据聚类方法。本发明步骤如下:①获取底层数据真实协方差结构,②根据协方差结构,对数据进行锐化降噪处理。本发明结果不仅能够从底层大幅度减低数据的不确定性,并且处理得到的锐化降噪数据能够应用在融合,分类等等其他领域,可扩展性极高。 | ||
搜索关键词: | 一种 不确定 数据 方法 | ||
【主权项】:
一种不确定数据的聚类方法,其特征在于:步骤如下:①获取底层数据真实协方差结构:数据集中包含
条均值表示为
的不确定性记录,对应的概率分布函数表示为
,数据记录
的第
个元素表示为
,第
条记录的第
个元素的概率分布表示为
,将数据记录
第
维的源值表示为
,由
加上
得到
的值,因此
表示在构造分布
的均值过程中产生的噪音,由此给出:![]()
;将数据库
第
维对应的随机变量表示为
;将对应于源数据第
维的真值
的随机变量表示为
,对应于
的第
维的随机变量表示为
,则:
;将源数据第
维和第
维的协方差表示为
,并希望
和
得到
,获取源数据真实协方差结构的求解公式:
,以此来估计协方差
的值;
的值可以由观测数据得到,它所构成的协方差矩阵叫做
或者
;当
时,
的值就是个方差,我们用
来表示,假定
的标准差为
,
第
维的的值可以由对应的概率密度函数的方差的均值给出,
的值由如下公式得到:
,构成的矩阵叫做
或者
;根据上述估计
的值,用于构造协方差矩阵
或者叫做
,得到源数据真实的协方差结构;②根据协方差结构,对数据进行锐化降噪处理:
其中,矩阵
中包含着相应的特征值,
中是与特征值相对应的特征向量,将协方差矩阵中的特征值
中元素按照从大到小方式进行排序:
并将对应排序的顺序保存在
中;将
中的特征向量按照对应特征值的大小进行排列,得到主要特征向量构成的投影矩阵:![]()
利用投影矩阵将
转化成
:
,
就是经过处理锐化后的数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510666299.9/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置