[发明专利]一种基于机器学习算法的IDC流量数据预测方法及装置有效
申请号: | 202010450312.8 | 申请日: | 2020-05-25 |
公开(公告)号: | CN111614520B | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 李欢欢;陈亚萍 | 申请(专利权)人: | 杭州东方通信软件技术有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L12/24;G06N20/00 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
地址: | 310013 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 算法 idc 流量 数据 预测 方法 装置 | ||
1.一种基于机器学习算法的IDC流量数据预测方法,其特征在于,包括:
利用滑窗对任一时刻IDC流量数据进行特征提取,以获取流量数据特征;其中,所述流量数据特征至少包括IDC流量数据的时序特征、固有特征和统计特征;
将所述IDC流量数据的时序特征、固有特征和统计特征输入到预置的IDC流量数据预测模型中,得到所述任一时刻的下一时刻的流量数据;其中,所述预置的IDC流量数据预测模型为,以具有周期性的IDC历史流量数据在历史任一时刻对应的时序特征、固有特征和统计特征为输入,以所述历史任一时刻的下一时刻的IDC历史流量数据为输出对机器学习模型进行训练得到,具体包括:
获取具有周期性的IDC历史流量数据在历史任一时刻对应的时序特征、固有特征和统计特征,作为训练数据;其中,所述训练数据划分为训练集和测试集;
将所述训练集中的训练数据切分为两部分;其中,训练集中的一部分训练数据用于训练机器学习模型,另一部分训练数据作为验证集;
将用于训练机器学习模型的训练数据和与训练机器学习模型的训练数据对应的下一时刻的IDC历史流量数据输入到LightGBM模型和XGBoost模型中,得到训练后的LightGBM模型和训练后的XGBoost模型;
将所述验证集中的训练数据分别输入训练后的LightGBM模型和训练后的XGBoost模型中,得到两列训练集大小的向量;
将所述两列训练集大小的向量输入次级学习器Linear Regression模型中,得到初步的IDC流量数据预测模型;
利用所述测试集对所述初步的IDC流量数据预测模型进行测试调优,得到所述预置的IDC流量数据预测模型。
2.根据权利要求1所述的方法,其特征在于,所述利用滑窗对任一时刻IDC流量数据进行特征提取,以获取流量数据特征,包括:
利用滑窗对所述任一时刻IDC流量数据进行特征提取;
利用相关系数法和前向搜素法对提取的特征进行选择,获取到所述任一时刻IDC流量数据的流量数据特征。
3.根据权利要求1所述的方法,其特征在于,所述利用滑窗对任一时刻IDC流量数据进行特征提取,以获取流量数据特征之前,所述方法还包括:
对所述任一时刻IDC流量数据进行预处理;其中,所述预处理至少包括:缺失值处理、异常值处理和/或数据平滑处理。
4.一种基于机器学习算法的IDC流量数据预测装置,其特征在于,包括:
特征提取模块,用于利用滑窗对任一时刻IDC流量数据进行特征提取,以获取流量数据特征;其中,所述流量数据特征至少包括IDC流量数据的时序特征、固有特征和统计特征;
流量数据得到模块,用于将所述IDC流量数据的时序特征、固有特征和统计特征输入到预置的IDC流量数据预测模型中,得到所述任一时刻的下一时刻的流量数据;其中,所述预置的IDC流量数据预测模型为,以具有周期性的IDC历史流量数据在历史任一时刻对应的时序特征、固有特征和统计特征为输入,以所述历史任一时刻的下一时刻的IDC历史流量数据为输出对机器学习模型进行训练得到,具体包括:
获取具有周期性的IDC历史流量数据在历史任一时刻对应的时序特征、固有特征和统计特征,作为训练数据;其中,所述训练数据划分为训练集和测试集;
将所述训练集中的训练数据切分为两部分;其中,训练集中的一部分训练数据用于训练机器学习模型,另一部分训练数据作为验证集;
将用于训练机器学习模型的训练数据和与训练机器学习模型的训练数据对应的下一时刻的IDC历史流量数据输入到LightGBM模型和XGBoost模型中,得到训练后的LightGBM模型和训练后的XGBoost模型;
将所述验证集中的训练数据分别输入训练后的LightGBM模型和训练后的XGBoost模型中,得到两列训练集大小的向量;
将所述两列训练集大小的向量输入次级学习器Linear Regression模型中,得到初步的IDC流量数据预测模型;
利用所述测试集对所述初步的IDC流量数据预测模型进行测试调优,得到所述预置的IDC流量数据预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州东方通信软件技术有限公司,未经杭州东方通信软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010450312.8/1.html,转载请声明来源钻瓜专利网。