[发明专利]一种基于攻击原理的网络攻击数据自动生成方法及系统在审
申请号: | 202011136352.1 | 申请日: | 2020-10-22 |
公开(公告)号: | CN112261045A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 冯林;崔翔;田志宏;孙彦斌;谭庆丰 | 申请(专利权)人: | 广州大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06N20/00 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 陈旭红;吴落 |
地址: | 510006 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 攻击 原理 网络 数据 自动 生成 方法 系统 | ||
本发明提供一种基于攻击原理的网络攻击数据自动生成方法及系统,其中,所述方法包括:根据网络攻击公开信息建立攻击原理模型;其中,所述网络攻击公开信息包括:网络攻击分析代码数据及网络攻击公开报告;根据所述攻击原理模型建立基于攻击原理的数据生成系统;通过所述基于攻击原理的数据生成系统生成的数据,训练网络安全防御模型。本发明通过配置文件的编辑即可大批量、定制化生成逼真的、有效的目标数据,可以满足网络安全防御AI模型训练和测试阶段的数据需求,遵循本方法设计实现的生成系统,网络安全防御AI模型用户通过简单编辑配置文件,即可定制化生成大量目标攻击数据,用于模型训练和测试。
技术领域
本发明涉及网络安全技术领域,特别是涉及一种基于攻击原理的网络攻击数据自动生成方法及系统。
背景技术
近年来,迅猛发展的人工智能技术在各领域得到了广泛应用。同样的,人工智能技术助力网络安全防御,可以有效提升防御方势能。目前,已经存在部分应用了人工智能技术的网络安全类产品,其安全防御能力和行业竞争力得到了显著提升。众所周知,传统的机器学习、神经网络、深度学习等人工智能模型(AI模型),不仅需要相关理论基础,也离不开数据集的支撑。值得注意的是,AI模型能在应用于解决实际问题时产生较大有益作用的前提是:拥有大量完备的可用数据集。然而网络安全领域的特殊性,使得这类模型的可用数据集紧缺的问题尤为突出。网络安全领域的特殊性,包括但不限于网络攻击事件发现滞后、攻击事件复杂、分析溯源困难等,使得现有网络攻击检测类的AI模型大多面临一个共同的挑战——拥有足量、完备的可用数据来支撑模型的训练和测试。
当前AI模型用户,使用较多的是公开可获得的真实攻击数据。这类数据大多来源于已追踪到的真实网络攻击,不仅公开可获得的数据稀少,还存在时效性滞后、完备度不足的问题。在应用研究方面,较多论文中的模型也采用了另一种替代解决方法:以企业内网、校园网络、合作IPS等特定网络的流量数据作为背景(白样本),并在沙箱中运行少量恶意样本;或者直接使用部分红蓝对抗、CTF比赛数据,从而构造数据集。这种捕获重运行类的解决方案虽然可以使AI模型有数据集可用,但多数论文作者并不公开其研究工作所使用的数据集,因此这类数据集的可信度、真实性和可用性已经开始受到质疑,基于该类数据集训练得到的AI模型在生产环境下的实际性能也无从验证。
参考其他领域中解决数据集问题的思路,类似的研究主要有GAN方法生成和数据增强技术。利用GAN来自动化生成网络攻击数据,即设计生成器来学习输入的恶意样本数据特征,在此基础上进行泛化后得到更多数据;这种方式是立足于机器学习特征一级进行的,基于这些特征泛化特征参数值,此方法生成的数据受限于特征工程的处理。此外,数据增强在解决图片数据和文本数据问题方面已取得很好效果;但具体应用到网络攻击数据增强中,其增强保证性假设要求增强后的样本数据与原数据保持主要特征、分布特征的一致性,对应到网络攻击数据增强则表现为:增强后的样本数据仍然能达成原有攻击意图,以及仍然遵循基本的攻击原理;然而这是现有技术难以完成的。不仅如此,GAN网络生成方法和数据增强的方法均存在一个难题——难以验证所得到样本数据的有效性和一致性。
发明内容
本发明提供一种基于攻击原理的网络攻击数据自动生成方法及系统,该方法可以按AI模型用户需求,定制化生成大量逼真的、完备度可控可调的网络攻击数据,这些数据用于满足AI模型对训练和测试数据质与量的需求;最后,辅以真实、可获得的攻击数据作为训练所得模型的验证数据,从而解决当前AI模型训练过程中面临的可用数据紧缺、完备度不足的问题。
本发明一个实施例提供一种基于攻击原理的网络攻击数据自动生成方法,包括:
根据网络攻击公开信息建立攻击原理模型;其中,所述网络攻击公开信息包括:网络攻击分析代码数据及网络攻击公开报告;
根据所述攻击原理模型建立基于攻击原理的数据生成系统;
通过所述基于攻击原理的数据生成系统生成的数据,训练网络安全防御模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011136352.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种试验仪器的提升装置
- 下一篇:一种基于电子地图构建网上展览平台的方法