[发明专利]一种用于数据聚类的相似性网络融合快速方法在审

专利信息
申请号: 201410625530.5 申请日: 2014-11-07
公开(公告)号: CN104392247A 公开(公告)日: 2015-03-04
发明(设计)人: 张重阳;卢贤龙 申请(专利权)人: 上海交通大学
主分类号: G06K9/66 分类号: G06K9/66
代理公司: 上海汉声知识产权代理有限公司 31236 代理人: 徐红银;郭国中
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 数据 相似性 网络 融合 快速 方法
【权利要求书】:

1.一种用于数据聚类的相似性网络融合快速方法,其特征在于包括:相似性网络提前训练存储,相似性网络的快速融合;其中:

所述相似性网络提前训练存储是指利用样本间的距离计算样本的不同特征的相似性网络,对于这一过程中得到的网络进行存储,用来做之后对新样本所进行的相似性网络的快速融合。

2.根据权利要求1所述的一种用于数据聚类的相似性网络融合快速方法,其特征在于:所述相似性网络提前训练存储,存储了相似性网络融合计算过程中的中间网络,这些网络用于最后进行快速相似性网络融合;同时,使用存储下来的中间网络,进行相似性网络融合模型快速计算。

3.根据权利要求1或2所述的一种用于数据聚类的相似性网络融合快速方法,其特征在于:所述相似性网络的快速融合是指:对于不同特征的相似性网络进行有效的划分存储,然后进行迭代融合计算,实现快速分类。

4.根据权利要求3所述的一种用于数据聚类的相似性网络融合快速方法,其特征在于:所述相似性网络的快速融合,是对添加新样本到原训练样本集中进行相似性网络的快速融合,对于一个新样本,同样需要计算矩阵W,S,P,其中有很大一部分与训练阶段计算结果十分相似,将该部分计算用训练阶段存储的矩阵信息进行替换。

5.根据权利要求3所述的一种用于数据聚类的相似性网络融合快速方法,其特征在于:所述对于不同特征的相似性网络进行有效的划分存储,是指:利用相似性网络提前训练存储阶段存储的矩阵,矩阵划分方法为:

对一个(n+1)*(n+1)的矩阵划分出左上角n*n的矩阵作为PartI,划分出右侧(n+1)*1的矩阵作为Part II,划分出左下方1*n的矩阵作为PartIII,其中Part I的部分都可以用训练阶段的矩阵替换,在线分类阶段实际需要计算的是Part II和Part III,测试阶段的S矩阵用下式计算,其中1≤i≤n+1;j=n+1,Ni表示xi的K个近邻,K的取值依据是具体数据集规模:

Stest(1)(i,j)=W(i,j)ΣkNiW(i,k),jNi0,otherwise]]>

上述矩阵划分方法同时适用于S,P矩阵,矩阵P的第一个初始矩阵也类似计算;在用于矩阵初始化计算完成之后,进行迭代融合计算。

6.根据权利要求5所述的一种用于数据聚类的相似性网络融合快速方法,其特征在于:所述的迭代融合计算,具体为:

利用之前相似性网络提前训练存储阶段存储的矩阵,进行该阶段的相似性网络的融合,将S,P矩阵都分为四个部分,划分方法为:

对一个(n+1)*(n+1)的矩阵划分出左上角n*n的矩阵作为第1部分,划分出右上方n*1的矩阵作为第2部分,划分出左下方1*n的矩阵作为第3部分,划分出右下方1*1的矩阵作为第4部分;

当已知第t-1次迭代的情况时,根据公式先计算S(v)×(ΣkvP(k)m-1)]]>部分如下

S1S2S3S4×P1P2P3P4=Temp1Temp2Temp3Temp4]]>

其中S矩阵本权利要求中所述划分方法得到S1,S2,S3,S4,定义为矩阵P,那么P1,P2,P3,P4即为该划分方法得到的矩阵块;等式的右边是一个临时矩阵,记为Temp,是Temp1,Temp2,Temp3,Temp4即为该划分方法得到的Temp的矩阵块;

事实上,S1×P1近似于训练过程中的S×P,S、P分别为S矩阵与P矩阵,因而有训练过程中中间存储得到的S×P进行替换Temp1,按下面的公式计算Temp2,Temp4,并用Temp2的转置近似代替Temp3:

Temp2Temp4=S1S2S3S4×P2P4]]>

最后,计算公式中的×(S(v))T部分,公式前半部分的结果存在临时矩阵Temp中,P(v)按权利要求中所述划分方法得到P(v)是第v类特征下一次迭代过程中标准化的相似性矩阵,可得

P2(v)=Temp1Temp2×S2S4]]>

同理计算出只是数学计算的中间步骤,因而得到整个P(v),又对称地,得到对于任意i类特征在下一次迭代过程中的标准化的相似性矩阵P(i),至此,根据当前的迭代情况,完全计算得到下一次的迭代情况;又已知初始情况,由数学归纳法易得,可以计算得到迭代完成的情况;根据迭代得到最后的P矩阵即最后的标准化的相似性矩阵,从而实现了相似性网络融合的快速方法;

结合部分标定的数据,采用半监督学习标签传递的方法,即可以对新样本进行聚类或分类。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410625530.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top