[发明专利]一种基于随机森林的故障可能性预估方法在审
申请号: | 202110230691.4 | 申请日: | 2021-03-02 |
公开(公告)号: | CN112949714A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 李金龙;张辉;鲁秋子;曲鸣川;李娇 | 申请(专利权)人: | 北京城建设计发展集团股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 北京一枝笔知识产权代理事务所(普通合伙) 11791 | 代理人: | 张庆瑞 |
地址: | 100000 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 森林 故障 可能性 预估 方法 | ||
1.一种基于随机森林的故障可能性预估方法,其特征在于,包括以下步骤:
步骤1、获取设备上报的检测状态和参数,并将所述检测状态和所述参数作为原始样本集;
步骤2、根据所述原始样本集,构建随机森林模型,所述随机森林模型包括若干用于互补的决策树;且若干所述决策树分类器的输出结果遵循大多数投票法则;
步骤3、将测试数据输入所述随机森林分类器中,得到诊断结果。
2.如权利要求1所述的一种基于随机森林的故障可能性预估方法,其特征在于,所述步骤2、根据所述原始样本集,构建随机森林模型,所述随机森林模型包括若干用于互补的决策树;且若干所述决策树分类器的输出结果遵循大多数投票法则,包括:
步骤2.1、对所述原始样本集进行预处理;
步骤2.2、通过放回抽样的套袋法随机化生成若干相互独立的训练集;
步骤2.3各所述训练集分别生成一棵决策树,且随机选取各训练集中的特征进行决策树的节点分裂;
步骤2.4、采用大多数投票法则的方式得到若干决策树的输出结果。
3.如权利要求2所述的一种基于随机森林的故障可能性预估方法,其特征在于:在所述步骤2.3中采用的分裂方式为基于条件概率的无偏分裂,其中所述无偏分裂的表达公式为:
其中,mi为属性Ai的值;p(vi,j)为属性Ai是vi值的概率;c为训练样本中类别的个数,p(yi|vi,j)为类标yi在属性Ai条件下值为vi的概率;p(yi)为类标yi出现的概率。
4.如权利要求2-3任一项所述的一种基于随机森林的故障可能性预估方法,其特征在于,所述步骤2、根据所述原始样本集,构建随机森林模型,所述随机森林模型包括若干用于互补的决策树;且若干所述决策树分类器的输出结果遵循大多数投票法则,还包括:步骤2.5、使用随机森林分类器进行变量重要性的计算,得到单个特征的重要性。
5.如权利要求4所述的一种基于随机森林的故障可能性预估方法,其特征在于,所述步骤2.5、使用随机森林分类器进行变量重要性的计算,得到单个特征的重要性,包括:
步骤2.5.1、将袋外数据根据类别k(k=1……c)分成00b1、00b2、……、00bc子样本;
步骤2.5.2、利用00bk测试所述随机森林分类器准确性,获得一个准确参考值
步骤2.5.3、将00bk中第hth变量的值随机打乱,获得新的测试样本,使用新的测试样本测试所述随机森林分类器准确性,或得另一个准确参考值
其中mg(y,X)为间隔函数,
步骤2.5.4、输出第hth变量的变量重要性,表达式为:
其中k=1……c。
6.如权要求2所述的一种基于随机森林的故障可能性预估方法,其特征在于:经过所述步骤2.2得到的所述训练集的大小与所述原始样本集的大小相同。
7.如权要求2所述的一种基于随机森林的故障可能性预估方法,其特征在于:在所述决策树的节点分裂过程中,各所述训练集中选取的候选特征的数目相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京城建设计发展集团股份有限公司,未经北京城建设计发展集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110230691.4/1.html,转载请声明来源钻瓜专利网。