[发明专利]基于改进ER规则的Stacking集成学习围岩分级方法、装置及介质在审
申请号: | 202310249386.9 | 申请日: | 2023-03-15 |
公开(公告)号: | CN116502145A | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 王明年;赵思光;童建军;夏覃永;易文豪;李泽星;彭鑫;林鹏;孙鸿强 | 申请(专利权)人: | 西南交通大学;中国国家铁路集团有限公司 |
主分类号: | G06F18/2415 | 分类号: | G06F18/2415;G06F18/214;G06N20/20;G06Q50/08 |
代理公司: | 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 | 代理人: | 何健雄 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 er 规则 stacking 集成 学习 围岩 分级 方法 装置 介质 | ||
1.一种基于改进ER规则的Stacking集成学习围岩分级方法,其特征在于,包括如下步骤:
S1、构建围岩智能分级基模型;
S2、基于准确率和错误样本类型计算基模型可靠性,基于概率向量多样性度量计算基模型权重;
S3、基于得到的基模型的可靠性和权重改进ER规则,构建Stacking集成学习模型;
S4、依据构建的集成学习模型完成隧道围岩智能分级。
2.根据权利要求1所述的基于改进ER规则的Stacking集成学习围岩分级方法,其特征在于:所述步骤S1中包含2个及以上输入为地质信息、输出为围岩级别的围岩智能分级模型;所述地质信息包括推进速度、冲击压力、推进压力、回转压力的凿岩台车钻进参数。
3.根据权利要求1所述的基于改进ER规则的Stacking集成学习围岩分级方法,其特征在于:所述步骤S2中基于准确率和错误样本类型计算基模型可靠性,具体包括:
在准确率的基础上,增加错误样本惩罚因子来增加样本的数量,进而实现对准确率进行折减,并以此作为可靠性,即准确率≥可靠性,当准确率为100%时,错误样本数量为0,总样本数量不增加,二者相等;准确率和可靠性取值范围均为[0,1];
错误样本的惩罚因子随错误样本类型不同而不同,包括负变更和正变更惩罚因子,其中负变更惩罚因子大于正变更;同一变更类型情况下,错判级别和真实级别差别越大,惩罚力度越大,准确性折减程度越大;负变更错判一级的惩罚因子等价于正变更错判两级;
根据以上原则,确定基模型的可靠性计算公式如下:
式中,ri为第i个基模型的可靠性,n为基模型数量,Nc,i为第i个基模型的正确样本数量,分别为第i个基模型正、负变更时错判j级的样本数量,为其对应的惩罚因子,q为错判等级差。
4.根据权利要求1所述的基于改进ER规则的Stacking集成学习围岩分级方法,其特征在于:所述步骤S2中基于概率向量多样性度量计算基模型权重,具体包括:
定义两个分类基模型A、B对样本集中第j个样本的输出分类概率向量为PA,j、PB,j,表示为:
PA,j=[pA1,j,pA2,j,...pAc,j] 式(3)
PB,j=[pB1,j,pB2,j,...pBc,j] 式(4)
式中,c为分类标签数量;
将2个基模型概率向量中的元素从大到小进行排列,并返回其对应的类别标签值,得到分类器最大置信度概率由大到小排列对应的类标签向量LA,j、LB,j,表示为:
LA,j=[lA1,j,lA2,j,...lAc,j] 式(5)
LB,j=[lB1,j,lB2,j,...lBc,j] 式(6)
定义2个基模型单个样本下的多样性DAB,j计算公式为:
式中,ks为不同排序位置差异系数,且位置越靠前ks越大,ks的确定通过试算法和专家决策法,fABs,j为第j个样本不同排序位置差异因子,lAs,j为第j个样本基模型A排序为s的最大置信度概率;
对于含有m个样本的样本集而言,基模型A、B的多样性DAB为所有样本多样性的均值,计算公式为:
对于含有n个基模型的集成系统,第i个基模型的多样性Di,为该基模型和其他基模型的多样性之和,计算公式为:
式中,Dit为第i个基模型与第t个基模型的多样性;
最后,对将各基模型Di多样性进行归一化作为各基模型的权重wi,计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学;中国国家铁路集团有限公司,未经西南交通大学;中国国家铁路集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310249386.9/1.html,转载请声明来源钻瓜专利网。