[发明专利]一种基于EMD的断面客流神经网络预测方法有效

申请号：	201310699959.4	申请日：	2013-12-18
公开（公告）号：	CN103729688B	公开（公告）日：	2018-08-31
发明（设计）人：	王子洋;朱婕;秦勇;赵忠信;钟玲玲;于鸿飞;杜渺;李倩;李文宇;朱鹏;李军;刘靖;袁敏正;丁健隆	申请（专利权）人：	北京交通大学
主分类号：	G06Q10/04	分类号：	G06Q10/04;G06Q50/30;G06N3/02
代理公司：	北京众合诚成知识产权代理有限公司 11246	代理人：	薄观玖
地址：	100044 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 emd 断面客流神经网络预测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于EMD的断面客流神经网络预测方法，其特征在于，该方法步骤如下：

第一步：获取数据本征模函数分量；

将每日每30分钟间隔时段内OD间的汇总客流量分配到断面客流信息中，形成断面客流量原始序列；

根据数据的特征时间尺度来经验地识别出固有振荡模态，然后据此把一个非平稳信号分解为一系列本征模函数和一个冗余分量之和，即经验模式分解处理得到本征模函数IMF分量；

每个IMF分量需满足两个条件：

①过零点的数量与极值点的数量相等或至多相差一个；

②在任一时间点，局部最大值确定的上包络线和局部最小值确定的下包络线的均值为零，即信号关于时间轴局部对称；

第二步：组件识别；

将原始断面客流数据中不同尺度的波动或趋势逐级分解开来，产生一系列具有不同特征尺度的数据序列；最低频率的IMF分量代表原始序列的长期趋势或均值，最高频率的IMF分量代表原始序列的短期特征；相关系数ρ_xy是用以反映变量之间相关关系密切程度的统计指标，相关系数ρ_xy取值在-1到1之间，ρ_xy＝0时，称X、Y不相关；|ρ_xy|＝1时，称X、Y完全相关，此时，X、Y之间具有线性函数关系；|ρ_xy|<1时，X的变动引起Y的部分变动，|ρ_xy|越大，X的变动引起Y的变动就越大，|ρ_xy|>0.8时称为高度相关，当|ρ_xy|<0.3时，称为低度相关，其他为中度相关；这里，采用皮尔森相关系数；

式中：n—样本数量，—样本的平均值，S_X，S_Y—样本标准差；X_i为变量X的第i个样本值，Y_i为变量Y的第i个样本值；

第三步：BP神经网络预测；

(1)样本的选取

根据组件识别环节中剩余的有效序列，对其进行随机划分，80％为训练集，20％测试集；

(2)样本的归一化处理

由于采集的各数据单位不一致，因而须对数据进行[-1，1]归一化处理，归一化方法为：

X₀＝(X-X_min)/(X_max-X_min)， 13)

式中：X、X₀分别为转换前、后的值，X_max、X_min分别为样本的最大值和最小值；

(3)BP神经网络构建；

(3.1)输入、输出层节点确定；

输入层有M个输入节点，分别代表断面客流序列不同的IMF分量；输出层有N个输出节点，分别代表对应的未来的断面客流量；

(3.2)隐含层层数以及隐含层节点数确定；

所述隐含层层数为单隐层；

隐含层节点数公式：

式中：n为隐含层节点数，M为输入节点数，N为输出节点数，a为0-10之间的常数；

(3.3)传递函数选择

隐含层传递函数采用Tan-Sigmoid型函数；输出层传递函数采用线性purelin函数；①隐含层输出计算：

式中：net_i表示隐含层第i个节点的输入；y_i表示隐含层第i个节点的输出y_i；x_j表示输入层第j个节点的输入，j＝1,…,M；w_ij表示隐含层第i个节点到输入层第j个节点之间的权值；θ_i表示隐含层第i个节点的阈值；表示隐含层的传递函数；

②输出层输出计算：

式中：net_k表示输出层第k个节点的输入；o_k表示输出层第k个节点的输出；w_ki表示输出层第k个节点到隐含层第i个节点之间的权值，i＝1,…,q；a_k表示输出层第k个节点的阈值，k＝1,…,L；Ψ(x)表示输出层的传递函数；

MATLAB实现BP神经网络模型初始化的权重和阈值参数是随机产生的；

(3.4)学习参数选择

①学习速率的确定：

所述学习速率的选取范围在0.01-0.8；

②动量因子的确定：动量因子的取值范围在0-1之间；

(3.5)BP神经网络训练

使用LM算法进行BP神经网络训练；LM算法为：

设误差指标函数E(w)为

式中：Y_i—期望的网络输出向量；Y_i′—实际的网络输出向量；P—样本数目；w—网络权值和阈值所组成的向量；e_i(w)—第i个样本的网络权值和阈值所组成的向量误差；

设w^k表示第k次迭代的权值和阈值所组成的向量，新的权值和阈值所组成的向量w^k+1为w^k+1＝w^k+Δw；在LM方法中，权值增量Δw计算公式如下：

Δw＝[J^T(w)J(w)+μI]^-1J^T(w)e(w)， 19)

式中：e(w)为样本的网络权值和阈值所组成的向量误差；I—单位矩阵；μ—用户定义的学习率；J(w)—Jacobian矩阵，即：

从19)式可看出：如果比例系数μ＝0，则为高斯—牛顿法；如果μ取值很大，则LM算法接近梯度下降法，每迭代成功一步，则μ减小一些，这样在接近误差目标的时候，逐渐与高斯—牛顿法相似；高斯—牛顿法在接近误差的最小值的时候，计算速度更快，精度也更高；由于LM算法利用了近似的二阶导数信息，它比梯度下降法快得多；另外由于是正定的，所以19)式的解总是存在的，从这个意义上说，LM算法也优于高斯—牛顿法，因为对于高斯—牛顿法来说，J^TJ是否满秩还是个潜在的问题；在实际的操作中，μ是一个试探性的参数，对于给定的μ，如果求得的Δw能使误差指标函数E(w)降低，则μ降低；反之，则μ增加；用19)式修改一次权值和阈值时需要求n阶的代数方程(n为网络中权值数目)；LM算法的计算复杂度为O(n³/6)，若n很大，则计算量和存储量都非常大；然而，每次迭代效率的显著提高，可大大改善其整体性能，特别是在精度要求高的时候；

LM算法的计算步骤描述如下：

①给出训练误差允许值ε，常数μ₀和β(0<β<1)，并且初始化权值和阈值向量，令k＝0,μ＝μ₀；

②计算网络输出及第k次迭代的权值和阈值所组成的向量误差指标函数值E(w^k)；

③计算Jacobian矩阵J(w^k)；

④计算Δw；

⑤若E(w^k)<ε，转到⑦；

⑥以w^k+1＝w^k+Δw为权值和阈值向量，计算误差指标函数E(w^k+1)，若E(w^k+1)<E(w^k)，则令k＝k+1，μ＝μβ，转到②，否则μ＝μ/β，转到④；

⑦算法结束；

(4)BP神经网络预测

将测试数据作为输入层的输入数据，代入到BP神经网络中进行预测，得到输出与真实结果对比分析以及相对误差；

所述经验模式分解处理得到本征模函数IMF分量方法步骤如下：

(1)设原始信号为x(t)，找出其所有局部极值点，将所有的局部极大值点和局部极小值点分别用三次样条曲线连接起来，得到x(t)的上、下包络线；

对于一个信号非端点处的数据，通过它与相邻数据的大小关系判断它是否是极值点：如果它同时大于与它左右相邻的数据，即为极大值点；如果它同时小于与它左右相邻的数据，即为极小值点；对于端点处的数据，如果它大于与它相邻那个数据，则它是极大值点；

取出原极值点序列最左端的三个极值点，如果极大值点序列的个数小于三个则取序列中所有元素，对所取的极值点利用多项式拟合算法求出拟合多项式，计算出多项式对应数据序列左端点处的函数值，把此函数值作为极值点序列在该端点处的近似取值，同理求出极值点序列在右端点处的近似取值；最后利用三次样条函数对新极值点序列进行插值得到上下包络线；

之中所述多项式拟合算法步骤为：

a.确定拟合多项式的次数n；

b.计算出S_r和T_r；

离散数据点横坐标集合

离散数据点集合

c.写出正规方程：

d.解正规方程组求出a₀,a₁,...,a_n；写出拟合多项式：

多项式多项式系数a_k＝a₀～a_n，k为多项式的次数 4)

(2)记上、下包络局部均值组成的序列为m₁，令

h₁(t)＝x(t)-m₁， 5)

(3)判断h₁(t)是否满足上述IMF分量所需的两个条件，若不满足，则将其作为待处理信号，重复进行(6)、(7)两步，即，

h₂(t)＝h₁(t)-m₂， 6)