[发明专利]一种数据降维方法在审
申请号: | 201811243035.2 | 申请日: | 2018-10-24 |
公开(公告)号: | CN109189776A | 公开(公告)日: | 2019-01-11 |
发明(设计)人: | 李星南;曾瑛;林斌;付佳佳;施展;吴赞红 | 申请(专利权)人: | 广东电网有限责任公司;广东电网有限责任公司电力调度控制中心 |
主分类号: | G06F16/215 | 分类号: | G06F16/215 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张春水;唐京桥 |
地址: | 510600 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标函数 全局目标函数 高维数据 数据降维 核主成分分析 局部保持 投影矩阵 投影法 构建 预处理 相乘 核函数矩阵 自适应调整 平衡因子 冗余信息 数据集中 数据挖掘 运算过程 运行效率 核函数 数据集 求解 低维 高维 邻域 算法 去除 噪声 平衡 | ||
1.一种数据降维方法,其特征在于,包括:
对高维数据进行预处理得到高维数据集,并选取核函数;
构建基于核主成分分析的全局目标函数,并求解核函数矩阵;
自适应调整邻域参数值,采用局部保持投影法构建局部目标函数;
确定平衡因子值以平衡所述全局目标函数和所述局部目标函数,并将所述全局目标函数和所述局部目标函数结合为总体目标函数;
确定主成分个数与投影矩阵,将所述投影矩阵与所述高维数据集相乘得到低维数据集。
2.根据权利要求1所述的数据降维方法,其特征在于,所述对高维数据进行预处理得到高维数据集,并选取核函数的步骤包括:
对所述高维数据进行z-score标准化,得到高维数据集XT,XT=[x1,x2,…xn]∈Rm*n,其中,m为数据集的维度,n为数据样本个数;
选取高斯径向基函数作为所述核函数,所述高斯径向基函数为
3.根据权利要求2所述的数据降维方法,其特征在于,所述构建基于核主成分分析的全局目标函数,并求解核函数矩阵的步骤包括:
构建所述全局目标函数其中φ(X)T=[φ(x1),φ(x2),…,φ(xn)],vTv=1,v为投影向量;
其中,所述投影向量v在特征点φ(xi)的展开方向上存在一个向量u=(u1,u2,…,un)T,满足方程式
引入核函数k(xi,xj)=φ(xi)·φ(xj),得到全局目标函数Jglobal(u)=maxuTKTKu=maxuTCu其中,K为所述核函数矩阵,所述核函数矩阵uTKu=1u。
4.根据权利要求3所述的数据降维方法,其特征在于,所述自适应调整邻域参数值,使用局部保持投影法构建局部目标函数的步骤包括:
利用Parzen窗计算数据点的密度分布来自适应调整邻域参数ε,其中,所述Parzen窗的概率密度计算式n为数据样本个数,h为窗体宽度,V=hm为窗体体积,φ(x)为窗函数,且满足φ(x)≥0;
以余弦角距离计算式作为相似度函数、以正态窗函数作为所述窗函数φ(x),则数据点xi的邻域概率密度
根据所述邻域概率密度p(xi),并通过自适应调整所述邻域参数ε,其中,数据集分布的平均密度
通过自适应的所述邻域参数ε,可以确定数据的邻域关系为||φ(xi)-φ(xj)||2≤ε,则得到所述局部目标函数Jlocal(v)=min(vTφ(X)T(D-S)φ(X)v),其中,sij为权重参数,S为邻域图权重矩阵,D为对角矩阵;
通过引入核函数k(xi,xj)=φ(xi)·φ(xj),存在一个向量u,u=(u1,u2,…,un)T,满足方程式则所述局部目标函数转换为Jlocal(u)=min(uTKTLKu)=min(uTL'u),其中,矩阵L=D-S为拉普拉斯矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司;广东电网有限责任公司电力调度控制中心,未经广东电网有限责任公司;广东电网有限责任公司电力调度控制中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811243035.2/1.html,转载请声明来源钻瓜专利网。