[发明专利]一种基于知识蒸馏与自蒸馏的通信网络加密流量分类方法在审
申请号: | 202111382473.9 | 申请日: | 2021-11-22 |
公开(公告)号: | CN114095447A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 卜智勇;赵宇;鲁敏;周斌 | 申请(专利权)人: | 成都中科微信息技术研究院有限公司 |
主分类号: | H04L47/2441 | 分类号: | H04L47/2441;H04L47/2483;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 张杰 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 蒸馏 通信 网络 加密 流量 分类 方法 | ||
1.一种基于知识蒸馏与自蒸馏的通信网络加密流量分类方法,其特征在于,包括如下步骤:
S10,获取通信网络中的加密流量;
S20,构建并训练流量分类的基本模型;
S30,压缩训练好的基本模型,获取流量分类压缩模型;
S40,采用教师网络更新策略的知识蒸馏方式训练流量分类压缩模型;
S50,利用训练好的流量分类压缩模型进行通信网络加密流量分类。
2.根据权利要求1所述的基于知识蒸馏与自蒸馏的通信网络加密流量分类方法,其特征在于,步骤S10包括如下子步骤:
S11,通过捕获工具CapAnalysis或爬虫工具获取通信网络中的加密流量;
S12,对获取的通信网络中的加密流量进行类别标记;
S13,对每一类别的加密流量进行截断或补零处理,使得处理后的加密流量总长度为L字节;包括L1字节的TCP数据,L2字节的UDP数据以及L3字节的有效载荷数据;其中,L,L1,L2,L3均为正整数且L=L1+L2+L3;
S14,对加密流量的每一个字节进行归一化,即对每一字节除以255使每一字节的取值范围为[0,1];
S15,完成归一化后获得加密流量数据库,将加密流量数据库按照训练集p1%、测试集p2%、验证集p3%的比例进行划分,其中,p1%+p2%+p3%=100%。
3.根据权利要求2所述的基于知识蒸馏与自蒸馏的通信网络加密流量分类方法,其特征在于,步骤S20包括如下子步骤:
S21,构建流量分类的基本模型:
(1)记用于通信网络加密流量分类的基本模型为M,该基本模型M包括N个浅层部分,分别记作M1,M2,...,MN;每一个浅层部分均包括卷积层和batchnorm层;在每一个浅层部分最后的卷积层后面额外添加子模块,将N个浅层部分后的N个子模块分别记作M1′,M2′,...,MN′;每个子模块包含一个具有Vg个卷积核的卷积层以及一个softmax层;该softmax层的作用是使用softmax函数将输入到该softmax层的未归一化的每一类别对应的概率值映射为归一化的概率值;
(2)对于一个浅层部分Mi而言,其输入为特征图Xi,经过其对应的子模块的卷积层以后的输出为特征图Fi,经过其子模块对应的softmax层(T>1)以后输出软概率向量经过其子模块对应的softmax层(T=1)以后输出硬概率向量
S22,训练流量分类的基本模型:
(3)将训练集中的每一条加密流量,输入到基本模型中,采用所述损失函数进行训练,将损失函数的值对基本模型进行反向更新直到基本模型收敛后结束训练;
(4)训练结束以后,使用测试集对基本模型进行测试,以验证其泛化能力,对基本模型的结构以及训练得到的参数值进行保存,得到训练好的基本模型为E0。
4.根据权利要求3所述的基于知识蒸馏与自蒸馏的通信网络加密流量分类方法,其特征在于,所述softmax层中的softmax函数的表达式如下:
其中,a=1,2,...,C,b=1,2,...,C,C表示加密流量的类别总数;p∈[0,1]是一个概率值;T∈R表示温度值;za和zb表示输入到softmax层中的未归一化的每一类别对应的几率,当T=1时,对应的输出称为硬概率;当T>1时,对应的输出称为软概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都中科微信息技术研究院有限公司,未经成都中科微信息技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111382473.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:自回转耐高压在线密闭取样阀
- 下一篇:一种适用于新能源汽车的蓄电池固定装置