[发明专利]一种基于神经网络的流量预测方法在审
申请号: | 201810011664.6 | 申请日: | 2018-01-05 |
公开(公告)号: | CN108234496A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 滕建桓 | 申请(专利权)人: | 宝牧科技(天津)有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L12/24 |
代理公司: | 天津滨海科纬知识产权代理有限公司 12211 | 代理人: | 薛萌萌 |
地址: | 300041 天津市河北区万柳*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 流量预测 神经网络 采样 计算机数据 应用范围广 模型训练 时间周期 数据采样 数据判断 异常流量 数据集 训练集 检测 预防 | ||
本发明提供了一种基于神经网络的流量预测方法,按设定采样时间周期对计算机数据进行采样,确定训练集的窗口长度为3,配合使用数据采样、数据集设定、LSTM模型训练及数据判断,可以实现异常流量的预防和检测,具有自动程度高,检测速度快及应用范围广的特点。
技术领域
本发明属于网络人工智能领域,尤其是涉及一种基于神经网络的流量预测方法。
背景技术
随着信息技术的发展,工业控制系统逐步走向开放,互联,通用。很多工业控制协议逐渐运行于工业以太网上,如果能够预测工业以太网的流量速度,会给工业以太网的异常流量识别提供强大的技术保障。现有的技术方案,一般采用ARMA模型来预测互联网流量,但有如下缺点:第一、必需先通过人工收集大量的历史数据。第二、得到的预测函数仅仅适用当时收集数据的网线环境。第三、每种不同的场景都需要不同单独分析计算
发明内容
有鉴于此,本发明旨在提出一种基于神经网络的流量预测方法,配合使用数据采样、数据集设定、LSTM模型训练及数据判断,可以实现异常流量的预防和检测,具有自动程度高,检测速度快及应用范围广的特点。
为达到上述目的,本发明的技术方案是这样实现的:
一种基于神经网络的流量预测方法,包括:
步骤1:按设定采样时间周期对计算机数据进行采样,得到采样数据向量;X=[X1,X2,X3...Xt...Xn],Xt为时刻t的流量采样结果,n为采样数据个数;
步骤2:确定训练集的窗口长度为3,即利用前3个时刻t-2,t-1,t的数据Xt-2,Xt-1,Xt来预测下一个时刻t+1的实际流量Xt+1,其中为了方便于训练,t+1时刻的数据我们用ht+1表示,时刻t-2,t-1,t的数据用Zt=[Xt-2,Xt-1,Xt]表示,得到数据集[Z,h];
步骤3:将步骤2的数据集[Z,h]按4:1进行划分,其中的80%作为训练集,剩下的20%作为验证数据集;
步骤4:将步骤3中数据集[Z,h]的80%训练集,代入LSTM模型中,进行模型训练,得到LSTM模型;
步骤5:将步骤3中数据集[Z,h]的20%验证集,代入LSTM模型中,进行验证,防止过度拟合;
步骤6:对需要预测的计算机流量,按步骤1中相同的采样时间周期采样,得到三个数据X1,X2,X3,带入步骤5中的最终得到的LSTM模型,得到h4,即预测的X4;进一步采集实际的X4,组成X2,X3,X4,带入得到的LSTM模型得到X5;依次类推,可得到预测数据[X4,X5,X6,X7…]以及实际数据[X4,X5,X6,X7…],进而可进行异常流量的判断,当实际数据大于预测数据时,阻断对应的数据连接,防止DDoS攻击。
进一步的,在步骤1中,采样周期为1秒钟,采样时间为一周,这样n等于7*24*60*3600=36288000。
进一步的,在步骤3-5中,选择均方误差(mean squared error)作为误差的计算方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宝牧科技(天津)有限公司,未经宝牧科技(天津)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810011664.6/2.html,转载请声明来源钻瓜专利网。