[发明专利]一种基于随机森林与XGBoost的洪泛攻击检测方法在审
申请号: | 202010438357.3 | 申请日: | 2020-05-22 |
公开(公告)号: | CN111654479A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 杨武;苘大鹏;吕继光;王巍;玄世昌;张吉顺 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L12/24;H04L12/26;H04L12/721 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 森林 xgboost 攻击 检测 方法 | ||
本发明属于信息中心网络的洪泛攻击检测技术领域,具体涉及一种基于随机森林与XGBoost的洪泛攻击检测方法。本发明采用当前较流行的集成学习算法随机森林和梯度提升算法XGBoost,在特征选择方面,提出了基于集成学习思想的特征选择模型,模型采用随机森林算法,解决了模型特征选择问题,提高了检测模块构建的速度,降低了过拟合的风险,提升了检测模块的准确率。本发明解决了传统统计检测方法需要手动设置阈值的问题,方法通过模型学习得到分类标准,降低了阈值设置对检测率的影响,提升了分类效果,增加了虚假兴趣包洪泛攻击检测的准确率。
技术领域
本发明属于信息中心网络的洪泛攻击检测技术领域,具体涉及一种基于随机森林与XGBoost的洪泛攻击检测方法。
背景技术
信息中心网络作为极具潜力的下一代网络架构,摒弃了传统网络架构IP地址的概念,而是以内容作为网络的核心。信息中心网络在数据传输过程中是以内容名称为中心,而不管内容的具体来源,通过订阅-发布的方式实现生产者与消费者之间的通信。信息中心网络通过路由器节点缓存的特点减少传输的冗余数据,提高了传输效率,增加了网络利用率。所以,在信息中心网络架构中对路由节点有较高的性能要求。内容中心网络被广泛认为是信息中心网络的一种很有前途的表示和实现,是未来Internet体系结构的一个潜在候选人,本章开始以内容中心网络为例作为研究对象。内容中心网络的安全受到一个重要的安全隐患兴趣包洪范攻击的威胁,兴趣包洪范攻击是基于IP网络上DoS和分布式DoS攻击的演化。兴趣包攻击者可以在一个指定的数据网络中创建大量的恶意兴趣包,快速耗尽内容中心网络路由器的通信信道带宽和缓存容量,严重影响了路由器接收和转发普通用户的数据包的能力。
在传统IP网络中,洪泛攻击严重影响网络状态消耗大量的网络资源进而影响正常用户的请求。在内容中心网络中,由于在内容中心网络中兴趣包洪泛攻击消耗路由器中PIT表空间,当路由器接收正常用户的兴趣包而没有表空间则拒绝正常用户请求的兴趣包。此外,当攻击者采取间断攻击模式或在正常请求兴趣包下混杂攻击兴趣包,对于攻击的检测则变得更加困难。
发明内容
本发明的目的在于提供用于信息中心网络的,具有更高的性能,可以适应更加复杂的网络环境的一种基于随机森林与XGBoost的洪泛攻击检测方法。
本发明的目的通过如下技术方案来实现:包括以下步骤:
步骤1:提取内容中心网络路由器的数据,采集攻击情况以及正常情况下内容中心网络路由器节点相关的信息;将采集到的数据分为训练集以及测试集;
步骤2:采集内容中心网络路由节点的备选特征;计算内容中心网络路由器兴趣包的信息熵;
步骤3:采用随机森林特征选择算法对内容中心网络路由节点的备选特征进行特征的排序筛选,排除内容中心网络中冗余的属性,选择出有效的特征;
步骤4:依照筛选出的特征按照正样本以及负样本的比例对训练集进行数据采集,获得新特征下的训练集和测试集;
步骤5:用新特征下的训练集训练XGBoost模型;模型构建完成后,采用新特征下的测试集验证构建的模型,最终得到有效的XGBoost模型;
步骤6:将测试集中的数据输入到XGBoost模型中,得到检测结果。
本发明的有益效果在于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010438357.3/2.html,转载请声明来源钻瓜专利网。