[发明专利]基于stacking集成学习算法的时空数据预测方法有效
申请号: | 201811017900.1 | 申请日: | 2018-09-03 |
公开(公告)号: | CN109145175B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 贾兴林 | 申请(专利权)人: | 成都卡普数据服务有限责任公司 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06F18/15;G06F18/214;G06N20/20 |
代理公司: | 成都点睛专利代理事务所(普通合伙) 51232 | 代理人: | 李玉兴 |
地址: | 610000 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 stacking 集成 学习 算法 时空 数据 预测 方法 | ||
1.基于stacking集成学习算法的时空数据预测方法,其特征在于包括以下步骤:
1)、利用stacking集成学习算法建立时空数据预测模型;利用stacking集成学习算法建立时空数据预测模型的方法包括包括以下步骤:
A、针对时空数据预测任务的需要,提取一段历史时间内的时空源数据;
B、对提取的时空源数据进行时空数据处理得到时间、空间或时空维度上的动态特征数据集;所述时空数据处理包括数据异常识别、时空数据融合、时空动态特征数据生成三个基本数据处理过程;
C、设置时间分割点T0,将步骤B得到的动态特征数据集分为第一层数据集Data1和第二层数据集Data2,第一层数据集Data1和第二层数据集Data2的分割标准为:若动态特征数据集中的数据所对应的时间小于时间分割点T0,则将该数据划分至第一层数据集Data1中,动态特征数据集中的数据所对应的时间大于时间分割点T0,则将该数据划分至第二层数据集Data2中;
D、将第一层数据集中的数据随机拆分成n份,得到数据集{data11,data12,...,data1n};
E、将数据集{data11,data12,...,data1n}中的每个子集data1i(i∈[1,n])为训练样本,进行base模型的训练,得到base模型集合{basem1,basem2,…,basemn};
F、利用base模型预测第二层数据集Data2的结果{pred1,pred2,...,predn};
G、将第二层数据集Data2的静态空间特征、base模型的预测结果{pred1,pred2,…,predn}融合成高阶特征数据集NewData2;
H、在NewData2数据集上训练stacking模型,得到stackm模型;
I、将训练好的第一层{basem1,basem2,...,basemn}和第二层模型stackm组成整体模型结构得到时空数据预测模型;
2)、针对时空数据预测任务的需要,提取从当前时间开始往前一段历史时间内的时空源数据;
3)、将步骤2)获得的时空源数据集输入时空数据预测模型即可预测得到未来一段时间内的时空数据。
2.如权利要求1所述的基于stacking集成学习算法的时空数据预测方法,其特征在于:在步骤C中,所述第一层数据集Data1的数据量和第二层数据集Data2的数据量之比为7:3或6:4。
3.如权利要求2所述的基于stacking集成学习算法的时空数据预测方法,其特征在于:在步骤E中,每个base模型的训练包括参数寻优、模型训练以及数据预测。
4.如权利要求3所述的基于stacking集成学习算法的时空数据预测方法,其特征在于:所述base模型中的参数寻优算法采用随机搜索算法或贝叶斯搜索算法。
5.如权利要求4所述的基于stacking集成学习算法的时空数据预测方法,其特征在于:所述base模型中的模型训练算法采用决策树或随机森林或GBDT。
6.如权利要求5所述的基于stacking集成学习算法的时空数据预测方法,其特征在于:在步骤H中,所述stacking模型的训练包括参数寻优、学习训练以及数据预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都卡普数据服务有限责任公司,未经成都卡普数据服务有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811017900.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种应急地理信息快速制图系统及其制图方法
- 下一篇:电子文档管理系统