[发明专利]一种宏观经济多源混频大数据建模方法在审
申请号: | 201910213422.X | 申请日: | 2019-03-20 |
公开(公告)号: | CN109933621A | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 宋艳枝;孔京;杨路 | 申请(专利权)人: | 合肥黎曼信息科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/2457;G06F16/248;G06Q10/06;G06Q50/26 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 冯子玲 |
地址: | 230000 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种宏观经济多源混频大数据建模方法,涉及人工智能技术领域。本发明包括如下步骤:扩充响应变量,为高频解释变量加入建模提供建模基础;对获取的多源混频大数据进行特征处理,排除了变量间的共线性性和冗余变量对模型的干扰;根据解释变量的更新滞后时长和响应变量的频率确定解释变量前推的时间长度和跨越的历史时长,得到样本;使用回归器对数据进行训练和预测,得到分析结果。本发明通过对响应变量进行扩充,以及引入更多更高频的解释变量,得到细粒度更高的建模结果;引入了多源混频大数据构造训练样本训练模型,使得建模结果更客观,具有更好的可解释性。 | ||
搜索关键词: | 大数据 多源 混频 建模 建模结果 响应 人工智能技术 历史时长 频率确定 冗余变量 特征处理 训练模型 训练样本 共线性 回归器 解释性 细粒度 引入 前推 时长 样本 滞后 预测 更新 | ||
【主权项】:
1.一种宏观经济多源混频大数据建模方法,其特征在于,包括如下步骤:步骤S1、扩充响应变量:对响应变量进行扩充,获取高频的响应变量数据;步骤S2、数据获取:从多源渠道获取与宏观经济指标相关的混频大数据;步骤S3、特征分析:将获取的多源混频大数据进行特征处理,生成具备宏观经济意义的新特征变量;步骤S4、训练样本生成:根据数据更新滞后性和响应变量的频率确定解释变量数据前推时间长度和解释变量选取的历史时间长度,生成训练样本,划分成训练集和测试集;步骤S5、模型训练:选择合适的模型对训练集进行训练,并给出模型在测试集上的结果以及训练模型的参数;步骤S6、结果分析与展示:分析模型在测试集上的结果,结合训练模型参数给出解释变量的重要性排序;其中,步骤S3中,对多源混频大数据进行特征处理包括如下情况:当对单个变量时,采用缺失值填补、数据变化和数据标准化处理;当对多个变量时,采用降维、特征选择和协变量构造处理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥黎曼信息科技有限公司,未经合肥黎曼信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910213422.X/,转载请声明来源钻瓜专利网。
- 上一篇:基于Spark的火电大数据挖掘方法
- 下一篇:一种数据可视化系统及实现方法