[发明专利]一种基于随机森林特征提取的BP神经网络的数值预测方法在审
申请号: | 201910025537.6 | 申请日: | 2019-01-13 |
公开(公告)号: | CN109754122A | 公开(公告)日: | 2019-05-14 |
发明(设计)人: | 胡燕祝;王松 | 申请(专利权)人: | 胡燕祝 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N3/08;G06N99/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数值预测 随机森林 特征提取 预测 数据误差 样本 多组数据 机器学习 实验对比 数据挖掘 特征输入 特征选择 预测结果 噪声干扰 测试集 样本集 量化 更新 保证 | ||
1.基于随机森林特征提取的BP神经网络的数值预测方法,其具体归类步骤如下:
(1)选择袋外数据X1(x1,x2,...,xn),计算袋外数据误差error(1):
式中,g2,g3,...,gi是没有抽到的袋外数据,N为样本总数;
(2)随机对袋外数据所有样本的特征T(t1,t2,...,tm)加入噪声干扰,再次计算袋外数据误差error(2):
式中,g2,g3,...,gi是没有抽到的袋外数据特征中加入噪声的数据,N为样本总数;
(3)计算所有特征T(t1,t2,...,tm)的重要性I:
式中,N为决策树的个数,m为特征个数,error(1)为未加入噪声前袋外误差,error(2)为在特征中加入噪声后的袋外误差;
(4)确定重要性较大的特征T(t1,t2,...,ts)及其重要程度ω(ω1,ω2,...ωs):
设定最后需要预留的特征个数s,重复上述三步,删除重要性较小的特征,得到最终的特征T(t1,t2,...,ts)和特征对应的重要性程度ω(ω1,ω2,...ωs);
(5)训练BP神经网络,更新连接权值ωi:
将上一步骤得到的特征重要性程度设为输入层神经元和第一个隐藏层神经元之间的连接权值ω(ω1,ω2,...ωs),然后根据误差反向传播算法,更新连接权值ωi,具体公式如下:
其中,为实际输出值,yi为理想输出值,η为每次更新的步长;
(6)将测试集样本作为输入,进行特征选择然后将选择好的特征输入到BP神经网络中进行预测,得到预测结果,完成基于随机森林特征提取的BP神经网络的数值预测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于胡燕祝,未经胡燕祝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910025537.6/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理