[发明专利]基于核自编码器的模型训练方法、装置及存储介质在审
申请号: | 201910348033.8 | 申请日: | 2019-04-28 |
公开(公告)号: | CN111860552A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 龙春;肖喜生;魏金侠;赵静;杨帆 | 申请(专利权)人: | 中国科学院计算机网络信息中心 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;H04L29/06 |
代理公司: | 北京知舟专利事务所(普通合伙) 11550 | 代理人: | 郭韫 |
地址: | 100083 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 编码器 模型 训练 方法 装置 存储 介质 | ||
本发明实施例公开了一种核自编码器的模型训练方法、装置及存储介质,涉及网络安全领域。本发明的方法包括:通过核自编码器的编码模块,基于核PCA对样本特征进行降维处理,得到样本数据对应的隐层数据,并将所述隐层数据作为分类器的输入数据;通过核自编码器的解码模块,基于核回归处理得到所述样本的解码数据,并将所述解码数据作为所述分类器的输出数据;基于所述输入数据和所述输出数据,构建所述分类器的损失函数;根据所述损失函数,对所述分类器进行训练。本发明能够降低对数据特征的降维复杂度。
技术领域
本发明涉及网络安全领域,尤其涉及一种基于核自编码器的模型训练方法、装置及存储介质。
背景技术
随着计算机网络技术的迅速发展,网络技术在各个领域都得到了广泛的应用。计算机网络在给人们提供便利、带来效益的同时,网络攻击也对信息安全提出了很大的挑战。
为了防护网络攻击,可以通过入侵检测模型对网络流进行入侵预测。在模型训练过程中,样本数据原本的特征维度过高将导致计算复杂度大大增加,故而需要对样本特征进行降维处理。目前对样本特征进行降维处理的过程,直接将特征子集输入分类器,并根据分类器的性能对样本数据进行选择降维,这样的方式导致数据特征降维时的计算复杂度较高,进一步导致模型训练复杂度较高。
发明内容
本发明的实施例提供一种基于核自编码器的模型训练方法、装置及存储介质,能够降低对数据特征的降维复杂度。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本发明的实施例提供一种基于核自编码器的模型训练方法,包括:
通过核自编码器的编码模块,基于核PCA对样本特征进行降维处理,得到样本数据对应的隐层数据,并将所述隐层数据作为分类器的输入数据;
通过核自编码器的解码模块,基于核回归处理得到所述样本的解码数据,并将所述解码数据作为所述分类器的输出数据;
基于所述输入数据和所述输出数据,构建所述分类器的损失函数;
根据所述损失函数,对所述分类器进行训练。
结合第一方面,在第一方面的第一种可能的实现方式中,所述基于所述输入数据和所述输出数据,构建所述分类器的损失函数,包括:
计算所述输入数据和所述输出数据之间的差值;
将所述差值的模值,与正则化项相加,得到所述分类器的损失函数。
结合第一方面,或者第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,其特征在于,所述根据所述损失函数,对所述分类器进行训练,包括:
基于正则化结构风险最小化策略,将所述损失函数的值取最小值,对所述分类器进行训练。
结合第一方面,在第一方面的第三种可能的实现方式中,所述方法还包括:
当样本特征维度大于80维时,基于核PCA对样本特征进行降维处理后的特征维度小于原特征维度的三分之一;或,
当样本特征维度小于或等于80维时,基于核PCA对样本特征进行降维处理后的特征维度小于原特征维度的二分之一。
结合第一方面,在第一方面的第四种可能的实现方式中,所述分类器用于进行网络入侵检测,所述方法还包括:
将网络流量输入所述分类器,进行网络安全入侵检测;
响应于检测到存在入侵风险,截断当前网络流量并启动相应的入侵修复方案。
第二方面,本发明的实施例提供一种基于核自编码器的模型训练装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算机网络信息中心,未经中国科学院计算机网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910348033.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:自适应掩饰性监控平台、方法及存储介质
- 下一篇:一种打桩机