[发明专利]一种基于简化深度森林的电子信息系统试验数据预测方法在审
申请号: | 202210181534.3 | 申请日: | 2022-02-25 |
公开(公告)号: | CN114692721A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 张静克;王国玉;戚宗锋;王华兵;汪亚;邰宁;朱宁;王川川 | 申请(专利权)人: | 中国人民解放军63892部队 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 洛阳市凯旋专利事务所(普通合伙) 41112 | 代理人: | 林志坚 |
地址: | 471000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 简化 深度 森林 电子 信息系统 试验 数据 预测 方法 | ||
1.一种基于简化深度森林的电子信息系统试验数据预测方法,其特征在于:所述基于简化深度森林的电子信息系统试验数据预测方法具体操作步骤如下:
S1:开展电子信息系统性能评估试验,采集试验数据(试验数据由试验因子和试验响应组成),对试验数据集中试验因子进行预处理;
S2:将试验数据集中试验响应划分为不同的等级,并用不同的标签表示;
S3:将试验数据按照特定比例随机划分得到训练数据集(数据量为K1)和测试数据集(数据量为K2);
S4:构建并训练仅包含级联森林的简化深度森林模型;
S5:将测试集中的试验因子作为简化深度森林模型的输入,利用S4得到的简化深度森林模型进行预测,计算最后一层所有森林输出的均值向量,并以向量中最大值对应的序号为测试集的预测结果。
2.根据权利要求1所述的一种基于简化深度森林的电子信息系统试验数据预测方法,其特征在于:所述S1对试验数据中的试验因子进行预处理的过程包括以下步骤:
S1-1:定量因子归一化;把试验数据中的每一个定量因子归一化到[0,1]之间,归一化公式为:其中为试验数据集中某定量因子的取值,xmax和xmin分别为该因子的最大值和最小值,x为归一化后的取值;
S1-2:定性因子的数值化;电子信息系统性能评估试验中的定性因子通常为标称属性,即其取值只有两个状态,分别用为0和1代替。
3.根据权利要求1所述的一种基于简化深度森林的电子信息系统试验数据预测方法,其特征在于:所述S2中将试验结果划分为不同的等级并用不同的标签表示,需要根据专家知识以及系统的实际使用情况试验结果对应的性能指标划分为不同的等级,并用0、1、2、···、表示;假设分为N个类别,则各类别的取值为{0,1,…,N-1}。
4.根据权利要求1所述的一种基于简化深度森林的电子信息系统试验数据预测方法,其特征在于:所述S4构建并训练简化深度森林的方法为:
S4-1:构建及训练简化深度森林的第一层,简化深度森林的第一层由m个完全随机森林和m个随机森林组成;每个完全随机森林包含n颗完全随机树,每个随机森林包含n颗决策树;利用k折交叉验证将S3中的训练集分为k个互斥子集,然后依次取k-1个子集的并集作为训练集,剩下的那个子集作为测试集,得到k组新的训练集和新的测试集;利用k组新的训练集对该层中的每个森林进行k次训练,每个森林得到k个训练模型,依次将k次训练中的测试集输入到每个森林的k个训练模型中得到每个森林对训练集的预测结果(每组训练数据的预测结果为N维向量,整个训练集的输出维度为K1×N),将每个森林对训练集的预测结果拼接起来得到简化深度森林的第一层的输出(其维度为K1×2mN);同时对于每组训练数据,计算2m个森林输出的平均值,并以最大值对应的序号作为对输入的预测结果(其维度K1×1位),与输入的实际标签对比统计其预测准确率;
S4-2:构建及训练深度森林的第二层至第L层,其中L为正整数,为最大级联层数;简化深度森林的第二层至第L层与第一层的结构相同;当前层的输入由上一层的输出与训练集的试验因子拼接而成;与第一层的训练相同,利用k折交叉验证得到每个森林的训练模型、输出以及当前层对于训练集的预测准确率;对比当前层对于训练集的预测准确率与上一层对于训练集的预测准确率,当预测准确率的提升不超过阈值t时停止训练,此时得到对应的最优简化深度森林模型,否则继续增加级联森林的层数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军63892部队,未经中国人民解放军63892部队许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210181534.3/1.html,转载请声明来源钻瓜专利网。