[发明专利]一种宏观经济多源混频大数据建模方法在审
申请号: | 201910213422.X | 申请日: | 2019-03-20 |
公开(公告)号: | CN109933621A | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 宋艳枝;孔京;杨路 | 申请(专利权)人: | 合肥黎曼信息科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/2457;G06F16/248;G06Q10/06;G06Q50/26 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 冯子玲 |
地址: | 230000 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大数据 多源 混频 建模 建模结果 响应 人工智能技术 历史时长 频率确定 冗余变量 特征处理 训练模型 训练样本 共线性 回归器 解释性 细粒度 引入 前推 时长 样本 滞后 预测 更新 | ||
本发明公开了一种宏观经济多源混频大数据建模方法,涉及人工智能技术领域。本发明包括如下步骤:扩充响应变量,为高频解释变量加入建模提供建模基础;对获取的多源混频大数据进行特征处理,排除了变量间的共线性性和冗余变量对模型的干扰;根据解释变量的更新滞后时长和响应变量的频率确定解释变量前推的时间长度和跨越的历史时长,得到样本;使用回归器对数据进行训练和预测,得到分析结果。本发明通过对响应变量进行扩充,以及引入更多更高频的解释变量,得到细粒度更高的建模结果;引入了多源混频大数据构造训练样本训练模型,使得建模结果更客观,具有更好的可解释性。
技术领域
本发明属于人工智能技术领域,特别是涉及一种宏观经济多源混频大数据建模方法,该方法构建了一种细粒度更高的优于传统宏观经济指标建模方法的新型模型。
背景技术
宏观经济指标衡量了一个国家的经济发展水平,反映了一个国家的经济发展状况。宏观经济指标的建模结果对该区域未来的经济发展规划起到了一定的影响作用。但是目前,宏观经济指标由国家或地区统计局发布,受限于传统的指标计算方法,存在着发布维度较少、频率较低、时滞严重等问题。因此,这些指标难以及时准确地反映现实宏观经济发展的真实情况。而使用宏观经济多源混频大数据建模方法,能够更准确、更及时的反映当前区域经济的发展态势。为经济发展规划和监测经济发展过程中的突发性问题提供了有力的佐证,协助决策者更好的发展区域经济。
宏观经济多源混频大数据建模方法面临如下问题:
(1)如何更好地使用多源混频大数据构造出具有宏观经济意义的解释变量用于建模分析;
(2)如何挑选更优的模型对宏观经济指标进行预测;
(3)如何分析模型预测出的宏观经济指标的结果,从中挖掘出值得关注的点。
然而,目前框架下使用的模型仍是基于线性模型的改进模型,使得模型能够承受的解释变量的维度有一定的限制;因此,本发明提供了一种使用传统的建模数据和基于多源混频大数据直接的对比,宏观经济多源混频大数据建模方法在MAPE、Max-APE以及季度末的值的MAPE上都有较好的表现。
发明内容
本发明的目的在于提供一种宏观经济多源混频大数据建模方法,通过数据获取、特征分析、训练样本生成、模型训练、结果分析步骤设计的建模框架,解决了现有的模型解释变量维度有一定限制、结果分析困难的问题。
为解决上述技术问题,本发明是通过以下技术方案实现的:
本发明为一种宏观经济多源混频大数据建模方法,包括如下步骤:
步骤S1、扩充响应变量:对响应变量进行扩充,获取高频的响应变量数据;
步骤S2、数据获取:从多源渠道获取与宏观经济指标相关的混频大数据;
步骤S3、特征分析:将获取的多源混频大数据进行特征处理,生成具备宏观经济意义的新特征变量;
步骤S4、训练样本生成:根据数据更新滞后性和响应变量的频率确定解释变量数据前推时间长度和解释变量选取的历史时间长度,生成训练样本,划分成训练集和测试集;
步骤S5、模型训练:选择合适的模型对训练集进行训练,并给出模型在测试集上的结果以及训练模型的参数;
步骤S6、结果分析与展示:分析模型在测试集上的结果,结合训练模型参数给出解释变量的重要性排序;
其中,步骤S3中,对多源混频大数据进行特征处理包括如下情况:
当对单个变量时,采用缺失值填补、数据变化和数据标准化处理;
当对多个变量时,采用降维、特征选择和协变量构造处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥黎曼信息科技有限公司,未经合肥黎曼信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910213422.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于Spark的火电大数据挖掘方法
- 下一篇:一种数据可视化系统及实现方法