[发明专利]处理大规模矩阵数据的主成分分析方法在审

专利信息
申请号: 201611153472.6 申请日: 2016-12-14
公开(公告)号: CN106855918A 公开(公告)日: 2017-06-16
发明(设计)人: 喻文健;谷昱 申请(专利权)人: 清华大学
主分类号: G06F19/00 分类号: G06F19/00
代理公司: 北京清亦华知识产权代理事务所(普通合伙)11201 代理人: 张润
地址: 10008*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出一种处理大规模矩阵数据的主成分分析方法,包括生成随机数矩阵Ω;根据原始数据矩阵A计算矩阵G和H;初始化变量j=1、m×l矩阵Q和l×n矩阵B均为零矩阵;设定G[j,j+b]和Ω[j,j+b]分别为G和Ω的第j到j+b列,当j>1时,计算G[j,j+b]‑QBΩ[j,j+b]将结果覆盖G[j,j+b];对G[j,j+b]做简化QR分解,得到正交矩阵Q[j,j+b]和上三角方阵R;若j>1,计算Q[j,j+b]‑Q(QTQ[j,j+b])的简化QR分解,将得到的正交矩阵覆盖Q[j,j+b],得到计算将计算结果覆盖R;设H[j,j+b]为H的第j到j+b列,若j=1,计算否则计算得到矩阵Btemp;将变量j+b+1的值赋值给变量j;若j≤l,返回步骤四,否则执行下一步;对B做奇异值分解,得到前k个主成分向量和对应的奇异值。本发明适合于多种大数据分析场景,具有较高的计算效率和实用性。
搜索关键词: 处理 大规模 矩阵 数据 成分 分析 方法
【主权项】:
一种处理大规模矩阵数据的主成分分析方法,其特征在于,包括以下步骤:S1:在内存中生成一个n行、l列的随机数矩阵Ω;S2:选取原始数据矩阵A,并根据所述原始数据矩阵A计算矩阵G和H,并将矩阵G和H存储于内存中,其中,G=AΩ,H=ATG,所述原始数据矩阵A为m×n矩阵;S3:初始化变量j=1,并初始化m×l矩阵Q和l×n矩阵B均为零矩阵;S4:设定G[j,j+b]和Ω[j,j+b]分别为矩阵G和矩阵Ω的第j到j+b列,且当j>1时,计算G[j,j+b]‑QBΩ[j,j+b],并将计算结果覆盖G[j,j+b],其中,b为不超过l‑j的非负整数;S5:对矩阵G[j,j+b]做简化QR分解,得到m×(b+1)列正交矩阵Q[j,j+b]和上三角方阵R,其中,Q[j,j+b]存储在矩阵Q的第j到j+b列;S6:如果j>1,则计算矩阵Q[j,j+b]‑Q(QTQ[j,j+b])的简化QR分解,将得到的m×(b+1)列正交矩阵覆盖Q[j,j+b],以得到上三角阵为并计算矩阵乘法并将计算结果覆盖R;S7:设H[j,j+b]表示矩阵H的第j到j+b列,如果j=1,计算否则计算得到结果为(b+1)×n的矩阵Btemp,并将Btemp存储在矩阵B的第j到j+b行;S8:将变量j+b+1的值赋值给变量j;S9:如果j≤l,则返回执行所述S4,否则执行所述S10;S10:对矩阵B做奇异值分解:B=UΣVT,其中,矩阵V的前k列为所述前k个主成分向量,Σ的前k个对角元为所述对应的奇异值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201611153472.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top