[发明专利]基于主成分分析和线性判别分析的网络流量特征提取方法在审
申请号: | 202010203309.6 | 申请日: | 2020-03-20 |
公开(公告)号: | CN111464459A | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 曲桦;刘宇钦;赵季红;张艳鹏 | 申请(专利权)人: | 西安交通大学 |
主分类号: | H04L12/851 | 分类号: | H04L12/851;G06K9/62 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 郭瑶 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 成分 分析 线性 判别分析 网络流量 特征 提取 方法 | ||
1.基于主成分分析和线性判别分析的网络流量特征提取方法,其特征在于,包括以下步骤:
1)采用主成分分析法构造包含判别信息的投影矩阵WPCA;
2)将数据集X投影到特征矩阵WPCA,删除冗余特征不相关特征,得到特征集Y;
3)采用线性判别分析构造特征矩阵WLDA;
4)通过投影矩阵WLDA将特征集Y转换到特征空间WLDA,得到特征集Z。
2.根据权利要求1所述的基于主成分分析和线性判别分析的网络流量特征提取方法,其特征在于,步骤1)的具体过程如下:
a)将一条具有n个属性的数据流表示为大小为1×n的向量,全部的m条数据流构成大小为m×n的数据集X;
b)按照下列公式计算数据集X的协方差矩阵C;
φ=xi-μ (2)
A=[φ1,...,φm]T (3)
其中,μ表示整个数据集的平均值,是每条数据和平均值的差值,A为差别矩阵,C为协方差矩阵;
c)计算协方差矩阵C的特征值和特征向量,并将特征值由大到小进行排序;
d)取前k个最大的特征值对应的特征向量构成投影矩阵WPCA;其中,k为PCA特征空间中数据的维数。
3.根据权利要求2所述的基于主成分分析和线性判别分析的网络流量特征提取方法,其特征在于,步骤d)中,投影矩阵WPCA=[w1,...,wk],其中,w1为第一个最大的特征值对应的特征向量,wk为第k个最大的特征值对应的特征向量。
4.根据权利要求2所述的基于主成分分析和线性判别分析的网络流量特征提取方法,其特征在于,步骤d)中,投影矩阵WPCA中数据的维数为225。
5.根据权利要求2所述的基于主成分分析和线性判别分析的网络流量特征提取方法,其特征在于,步骤a)中,m的值为377526,n的值为248。
6.根据权利要求1所述的基于主成分分析和线性判别分析的网络流量特征提取方法,其特征在于,步骤2)中,特征集Y如下:
Y=WPCATX (5)。
7.根据权利要求1所述的基于主成分分析和线性判别分析的网络流量特征提取方法,其特征在于,步骤3)的具体过程如下:
3.1)计算特征集Y的类内离散度矩阵Sw和类间离散度矩阵Sb;
其中,i表示类别编号,N表示总类别数,yi表示经PCA变换后的每条流量数据,μi表示第i类的均值向量,mi表示第i类样本的数量,μ表示总均值向量;
3.2)利用广义瑞利商计算Sw-1Sb的特征值和特征向量;
其中,ω表示为LDA特征空间的基向量,J(ω)表示广义瑞利商;
3.3)将特征值由大到小进行排序,取前p个最大的特征值对应的特征向量构成投影矩阵WLDA;其中,p为LDA特征空间中数据的维数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010203309.6/1.html,转载请声明来源钻瓜专利网。