[发明专利]一种基于随机森林的隧道运营状态感知模型的建立方法在审
申请号: | 201710737045.0 | 申请日: | 2017-08-24 |
公开(公告)号: | CN107563425A | 公开(公告)日: | 2018-01-09 |
发明(设计)人: | 陈建勋;钱超;罗彦斌;张馨予;李伟;吉祥 | 申请(专利权)人: | 长安大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/06;G06Q50/26 |
代理公司: | 西安通大专利代理有限责任公司61200 | 代理人: | 安彦彦 |
地址: | 710064 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 森林 隧道 运营 状态 感知 模型 建立 方法 | ||
1.一种基于随机森林的隧道运营状态感知模型的建立方法,其特征在于,包括以下步骤:
步骤1):确定隧道运营监测训练集样本数N和变量数M;
步骤2):确定随机森林中参数ntree和mtry组合范围及初始值;其中,ntree为随机森林中决策树的数量,mtry为每一个分裂节点随机抽取变量数量,且mtry<M;
步骤3):利用Bootstrap法重采样有放回地随机抽取ntree个新的自助样本集并构建ntree棵决策树,每次未被抽到的样本组成ntree个袋外数据;
步骤4):每个自助样本集生长成为一棵决策树,在决策树的每个节点随机选取mtry个特征,从中选出一个特征进行分支生长,使决策树生长;
步骤5):根据生成的ntree棵决策树,对输入的训练集样本进行预测,同时计算每棵决策树袋外数据误差;
步骤6):分析每棵决策树的预测结果,即输出所有树中预测概率总和最大的那一个类得到最终分类结果,再平均所有树的袋外数据误差,得到随机森林泛化误差的无偏估计,同时计算程序运行时间;
步骤7):重复步骤2)-7),迭代运行所有ntree和mtry参数组合,输出所有参数组合对应的随机森林泛化误差的无偏估计和运行时间;
步骤8):确定随机森林中最优ntree和mtry参数组合值,建立基于随机森林的隧道运营状态感知模型。
2.根据权利要求1所述的一种基于随机森林的隧道运营状态感知模型的建立方法,其特征在于,步骤1)中确定隧道运营监测训练集样本数N的具体过程为:
首先自定义隧道运营状态感知问题:给定训练集T={(x1,y1),…,(xN,yN)}∈(X5×Y)N,其中,N为训练集样本数;xi∈X5表示模型输入的隧道运营监测样本数据集中第i个样本,包含CO、NO2、风速、细颗粒物、重载车的监测结果,yi∈Y={c1,c2,c3,c4}表示样本对应的轻度污染、中度污染、重度污染和严重污染四种状态中的一种,i表示训练集中样本编号,i=1,2,3,…,N,据此寻找状态空间X5上的一个决策函数f(x):X5→Y,用以推断任一监测样本对应的隧道运营状态。
3.根据权利要求1所述的一种基于随机森林的隧道运营状态感知模型的建立方法,其特征在于,N的数值大于500。
4.根据权利要求1所述的一种基于随机森林的隧道运营状态感知模型的建立方法,其特征在于,步骤4)中按照节点不纯度最小原则从中选出一个特征进行分支生长。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长安大学,未经长安大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710737045.0/1.html,转载请声明来源钻瓜专利网。