[发明专利]一种基于深度学习的因果关系挖掘方法在审
申请号: | 201910242406.3 | 申请日: | 2019-03-28 |
公开(公告)号: | CN109993281A | 公开(公告)日: | 2019-07-09 |
发明(设计)人: | 刘博;贺玺 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 因果关系 目标特征 备选 挖掘 测试集 学习 预处理 影响因素分析 数据归一化 海量数据 模型结构 缺失数据 时间序列 时序预测 最优模型 单变量 定量化 热编码 相减 预测 补充 记录 | ||
1.一种基于深度学习的因果关系挖掘方法,其特征在于:包括以下步骤:
步骤1、获取相关时间序列数据,并对这些数据进行清洗;
步骤2、针对数据缺失、不平滑情况对清洗后的数据进行预处理;
步骤3、针对预处理的数据进行模型搭建,构建训练集和测试集,参数优化得到预测模型的最优解;
步骤4、利用训练好的模型分别预测只有目标特征的数据和含有备选特征的数据,利用两次训练结果得到备选特征和目标特征的格兰杰因果关系分数。
2.根据权利要求1所述的一种基于深度学习的因果关系挖掘方法,其特征在于:步骤2具体包括以下步骤,
步骤2.1、针对数据中的缺失值,利用众数或者中位数来进行补全;
步骤2.2、对于类别特征需进行One-hot编码或者LabelEncoder将其标准化;
步骤2.3、针对不平稳的时间序列,通过一阶差分处理的方法将其转化成平稳序列;
步骤2.4、将时间序列问题转化为监督学习问题。
3.根据权利要求1所述的一种基于深度学习的因果关系挖掘方法,其特征在于:步骤3具体包括以下步骤:
步骤3.1、根据数据量大小切分训练集和测试集;
步骤3.2、定义LSTM模型,在第一隐层中定义50个神经元,在输出层中定义一个神经元用于预测的目标特征,输入形状将是带有所有备选特征的一个时间步;
步骤3.3、定义损失函数,使用平均绝对误差(MAE)损失函数和随机梯度下降的高效Adam版本,该模型将适用于批量大小为72的50个训练时期,然后训练LSTM模型,不断调整超参数,得到模型最优解。
4.根据权利要求1所述的一种基于深度学习的因果关系挖掘方法,其特征在于:步骤4具体包括以下步骤:
步骤4.1、利用上述模型,在仅含目标特征和包含所有备选特征的两种情况下分别预测目标值;
步骤4.2、得到两次预测的R2值,计算两次预测的R2值的差,即可得到备选特征和目标特征的格兰杰因果关系分数。
5.根据权利要求1所述的一种基于深度学习的因果关系挖掘方法,其特征在于:
首先要对数据进行预处理,包括将时间序列问题转化为监督学习问题、平稳时间序列、数据标准化;对于一个时间序列问题,可以通过使用从最后一个时刻的观测值作为输入的特征X和当前时刻的观测值作为输出Y来实现转换,因为需要转换的是一组时间序列数据,所以无法组合成想真正的监督学习那样有明确一对一的输入输出关系,尤其是在数据集的最开始或最后时,两个位置总有一个位置无法在训练集中找到对应关系,为了解决这样的问题,可以在最开始时将输入特征置为0,而它对应的输出就是时间序列的第一个元素;针对不平稳的时间序列,通过一阶差分处理的方法将其转化成平稳序列;其次,在数据输入前进行标准化可以非常有效的提升收敛速度和效果,尤其如果激活函数时sigmoid或者tanh,其梯度最大的区间是0附近,当输入值很大或者很小的时候,sigmoid或者tanh的变化就基本平坦了,也就是进行梯度下降进行优化的时候,梯度会趋于0,而导致优化速度很慢;而LSTM的默认激活函数时tanh函数,它的输出范围在[-1,1],同时这是时间序列数据的首选范围;因此可以使用MinMaxScaler类将数据集转换到[-1,1]的范围内;完成数据的预处理则能够构建LSTM模型,首先将准备好的数据集分解为训练集和测试集,然后将训练集和测试集分解为输入和输出变量,并将输入重塑成LSTM预期的3D格式,即[样例,时间步,特征];然后来定义和拟合LSTM模型,在第一隐层中定义50个神经元,在输出层中定义一个神经元用于预测的目标特征,输入形状将是带有所有备选特征的一个时间步,同时使用平均绝对误差MAE损失函数和随机梯度下降的高效Adam版本,该模型将适用于批量大小为72的50个训练时期,最后通过在fit()函数中设置validation_data()参数来跟踪训练期间的模型训练和测试损失,在运行结束时,训练和预测损失都被绘制出来,如图2所示;这里在测试集上,为了更好的刻画格兰杰因果关系强弱,使用R2来衡量预测的效果好坏,其公式为:
其中是预测到的时间序列,yi代表观察到的时间序列的真实值,表示这个时间序列的均值,因此,R2可以解释为改预测模型的解释方差,当该值越逼近1时,说明模型的预测效果越好,反之若为负值则说明该模型的预测能力为负,使用R2更为正式地定义格兰杰因果关系;通过仅用目标特征和使用所有备选特征进行两次预测,来计算两次预测在测试集上的R2的差值,称其格兰杰因果关系分数,从而量化备选特征与目标特征之间的格兰杰因果关系强弱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910242406.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于深度学习的水下声源定位方法
- 下一篇:一种台风波及范围的预测方法