[发明专利]一种对二维时频数据的数据降维方法有效
申请号: | 201810408401.9 | 申请日: | 2018-05-02 |
公开(公告)号: | CN108629371B | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 于雪莲;曲学超;徐丽;唐永昊;赵林森 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 陈一鑫 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 二维 频数 数据 方法 | ||
本发明公开了一种对二维时频数据的数据降维方法,应用于二维数据的降维和压缩。该方法主要流程:首先,对样本数据中心化;然后将中心化的数据映射到高维空间,并在高维空间使用核函数构建映射数据的协方差;最后利用双边二维主成分分析算法对协方差进行降维,得到特征投影变换矩阵。该算法不仅充分利用了原始数据中的非线性特征,而且所得特征投影矩阵系数量较少,这样既提高了识别率、数据压缩率,又减少了计算量。
技术领域
本发明涉及到二维数据的非线性特征的线性化,并提取线性化特征的主元,通过主元实现数据的降维与重构。主要应用于基于雷达时频分布、人脸特征等二维图像特征的目标识别与分类。
背景技术
主成分分析(Principal Component Analysis,PCA)把含有冗余信息的高维数据转化为少数低维数据即主成分,其中每个主成分包含原始数据几乎全部有效信息。这样将错综复杂的数据分析问题转化为只需研究少数主成分的问题,不仅能够更深入地分析问题,而且分析过程也变得很容易。其基本思想是在最小均方误差约束下寻找一个最能够代表原始数据主要特征的投影变换矩阵,在新的投影空间中不仅能降低原始数据的维数的而且还能保持其绝大部分信息。整个变换过程坚持两个原则:(1)最近重构性:使用降维后的数据,重新构建原始数据时误差之和最小;(2)最大可分性:数据在低维投影空间中尽量分开。事实上,可以证明这两原则是等价的。
PCA在处理二维时频数据时,需要将其转换为列向量,这样不仅破坏了时频数据的完整性,而且也会面临所求解高维列向量协方差矩阵不稳定、特征向量不精确等弊端。而二维主成分分析(Two-dimensional Principal Component Analysis,2DPCA)直接对二维数据进行降维识别,这样虽然很好地避免了将二维时频数据转换为一维向量所带来的诸多缺点。但是2DPCA对数据进行的是单边投影,仅考虑了右乘投影变换矩阵的情况,这样实际上仅仅利用了二维时频数据的行向量信息,而丢失了列向量信息。这样得到的投影变换矩阵维度(或系数量)比PCA的得到投影变换矩阵维度(或系数量)大很多。在基于该变换投影矩阵进行特征提取和分类时,计算量将会很大,耗时很长。双边二维主成分分析(BilateralTwo-dimensional Principal Component Analysis,B2DPCA)是H.Kong等人在2005年针对2DPCA在识别中存在的诸多缺点而提出的。该算法中的一些概念仍与PCA和2DPCA中的概念相同,而且变换过程中仍坚持最近重构性和最大可分性这两个原则。最大不同之处主要是构造了左投影矩阵和右投影矩阵,充分利用二维数据样本的行和列信息,并把样本投影到两个不同的空间,可以有效地消除数据行与列的冗余信息,降低了投影变换矩阵维度(或系数量),更重要的是该方法充分地考虑了数据的行与列相关信息,也使得分类变得简单易行。但是,该方法还存在不能利用数据中蕴含的非线性特征,因此利用该方法获得的主元进行目标识别分类时,并未充分利用原始数据中含有的特征,若将数据中非线性特征线性化可以进一步提高识别率。而核主成分分析(Kernel Principal Component Analysis,KPCA)通过非线性函数将数据非线性映射到高维空间,使得低维非线性特征线性化,对高维空间线性化特征进行降维时充分利用了原始空间中的非线性特征。但是KPCA处理二维数据时,仍会遇到PCA处理二维数据时存在的问题。在对二维数据降维时,为了即保证不破坏二维数据的完整性,又充分利用到原始数据中蕴含的利于分类的非线性特征,本发明提出了核双边二维主成分分析(Kernel Two-dimensional Principal Component Analysis,KB2DPCA)算法,该算法即实现了对数据进行双边降维,降低投影矩阵系数量,又通过核函数将数据中非线性特征线性化,充分利用线性化后的特征进行分类,进一步提高了识别率。
发明内容
本发明针对双边二维主成分分析算法对二维数据降维时,不能利用数据中蕴含的非线性特征,识别率不能达到理想的情况。而核主成分分析对二维数据进行降维时虽然利用了原始数据中蕴含的非线性特征,但是要求将二维数据转化为列向量,会产生破坏数据完整性、高维向量协方差不精确等新问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810408401.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置