[发明专利]一种基于异质集成学习的材料性能预测模型构建方法有效
申请号: | 201910053717.5 | 申请日: | 2019-01-21 |
公开(公告)号: | CN109918708B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 刘英莉;牛琛;沈韬;朱艳 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G16C60/00 | 分类号: | G16C60/00;G06N20/20;G06N20/10 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 集成 学习 材料 性能 预测 模型 构建 方法 | ||
1.一种基于异质集成学习的材料性能预测模型构建方法,其特征在于:包括如下步骤:
Step1、收集材料实验过程参数及通过这些过程参数所得的材料性能数据作为Stacking模型的数据集Data,并将数据集的70%作为训练数据集D_train,30%作为最终测试集D_test;
Step2、通过异质集成学习Stacking方法将SVM(Support Vector Machine,支持向量机)、NBM(Naive Bayesian Model,朴素贝叶斯模型)、NN(Neural Networks,神经网络)三种机器学习算法模型作为基学习器组成初级学习器;
Step3、将D_train分为训练部分和测试部分输入到初级学习器中对三个基学习器进行学习和拟合;
Step4、将每个基学习器的训练集中作为测试集的部分数据集合并作为次级学习器的训练数据集对次级学习器进行训练;
Step5、在Stacking模型训练完成后,将最终的测试数据集D_test输入Stacking模型中,经过初级学习器和次级学习器得到模型输出的材料性能参数;观察所得测试结果与测试集中已知的材料性能参数的拟合情况是否达到预设标准,若达到预设标准,则说明此异质集成学习Stacking模型搭建成功;
所述Step2中,初级学习器中三种基学习器机器学习算法模型具体如下:
SVM模型定义为:
αi为拉格朗日乘子,yi为输出,b为阈值;函数k(x,xi)为核函数,模型中使用RBF高斯核函数;
并且,构建SVM模型时采用SMO优化算法求出一系列α和b,从而计算出权重向量,进而得到预测模型;
NBM中,基于属性条件独立性假设,先得到后验概率:
其中P(c)为先验概率,P(x|c)为类条件概率,P(x)为x的概率,P(xi|c)为对应第i个事件的类条件概率,d为属性数目,同时,基于贝叶斯判定准则,这里采用的朴素贝叶斯表达式为:
对于NN模型,运用BP算法构建了一个5层前馈神经网络,隐层与输出层神经元都使用Sigmoid函数,此模型中在训练集上的误差目标函数为:
m为训练样例总数,Ek为第k个训练样例上的误差,ωi为连接权和阈值,λ∈(0,1)用于对经验误差和网络复杂度进行折中;
所述step4中,关于次级学习器算法模型的选择具体如下:
次级学习器模型由于要对初级学习器的三个模型结果进行集成加权投票,使用了在分类方面较为出色的决策树模型,此处使用信息熵与信息增益来对DT分支结点进行划分,对数据集D的信息熵定义为:
|γ|为样本总类别个数,pk为D中第k类样本所占比例,判别准则为Ent(D)的值越小,则D的纯度越高;
于是,可计算出划分所获得的信息增益:
假定离散属性a有V个可能取值{a1,a2,a3.....av},若用a来对样本集合D来进行划分,则会产生V个分支结点,其中第v个分支结点包含D中所有在属性a上取值为av的样本,记做Dv,
对于信息增益,信息增益越大,使用属性a划分所得的纯度提升越大,最终集成模型获得材料性能准确率越高,且有更强的泛化能力。
2.根据权利要求1所述的一种基于异质集成学习的材料性能预测模型构建方法,其特征在于:所述Step3的数据集D_train的划分具体步骤如下:
在初级学习器中,基于训练数据集D_train在初级学习器中采用3折交叉验证的方法,将每个基学习器所输入的训练数据集再次分割,其中2/3作为基学习器自身训练集B_train进行学习,1/3作为自身测试集进行测试拟合B_test。
3.根据权利要求2所述的一种基于异质集成学习的材料性能预测模型构建方法,其特征在于:所述Step3的学习和拟合具体实施步骤如下:
Step1、基于训练数据集B_train,分别输入到对应SVM、NBM、NN三种机器学习算法的三个基学习器Mt(t=1,2,3)中,得到三个基学习器的预测结果Zi(i=1,2,3),
Step2、将三个B_test数据集合并为一个数据集D′作为下一层模型DT的训练数据集进行学习训练,并得到基于训练数据集的预测结果Z_train。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910053717.5/1.html,转载请声明来源钻瓜专利网。