[发明专利]一种基于集成学习的近红外光谱定量建模方法有效
申请号: | 201710589783.5 | 申请日: | 2017-07-19 |
公开(公告)号: | CN107290305B | 公开(公告)日: | 2019-11-01 |
发明(设计)人: | 刘晶;吴跃进;王琦;余立祥;刘斌美;倪晓宇;杨阳;周子军;杨叶;詹玥 | 申请(专利权)人: | 中国科学院合肥物质科学研究院 |
主分类号: | G01N21/359 | 分类号: | G01N21/359 |
代理公司: | 合肥市浩智运专利代理事务所(普通合伙) 34124 | 代理人: | 丁瑞瑞 |
地址: | 230031 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于集成学习的近红外光谱定量建模方法,包括:确定初始数据集,包含用于建模的校正集和验证的预测集,并对数据进行预处理;将校正集样本按照聚类的策略分成p类,从每类中随机抽取一个样本构成子模型的验证集,余下的部分构成该子模型的校正集;采用选取的定量建模方法对子模型的校正集进行训练,通过模型输出对初始数据集中预测集的预测误差信息进行统计,并获得以预测误差的方差为参数的权函数;重复上述步骤,构建出多个子模型,并对各个子模型按照预测误差的方差加权得到稳健性强的定量校正模型;利用稳健性强的整体定量校正模型结合预测集样本完成定量建模。本发明具有以下优点:使整个模型的输出结果更加接近真实值。 | ||
搜索关键词: | 一种 基于 集成 学习 红外 光谱 定量 建模 方法 | ||
【主权项】:
1.一种基于集成学习的近红外光谱定量建模方法,其特征在于,包括以下步骤:步骤S101,确定初始数据集,包含用于建模的校正集(Xc,Yc)和验证的预测集(Xp,Yp),并对数据进行预处理;步骤S102,将初始数据集中的校正集样本按照聚类的策略分成p类,从每类中随机抽取一个样本构成子模型的验证集,余下的部分构成该子模型的校正集;步骤S103,采用选取的定量建模方法对子模型的校正集进行训练,通过模型输出对初始数据集中预测集的预测误差信息进行统计,并获得以预测误差的方差为参数的权函数;步骤S104,重复步骤102和步骤103一定次数,构建出多个子模型,并对各个子模型按照预测误差的方差加权得到稳健性强的定量校正模型;步骤S104的具体步骤为:步骤S201:选取子模型的校正集和验证集样本;步骤S202:选取定量校正方法构成弱学习机对子模型进行训练;步骤S203:利用选取的子模型校正集数据(Xi,Yi)和定量建模方法建立该子模型Yi=Xi*betai+Ei,并得到该子模型的输出参数betai,根据betai对子模型验证集样品(Xt,Yt)进行预测Ypred=Xt*betai+Ep,得到预测误差Ep=|Yt‑Ypred|;步骤S204:统计各个子模型的预测误差的方差;步骤S205:利用各个子模型的方差构造权重函数;步骤S206:利用权重函数修正各子模型的输出参数beta;步骤S207:利用修正后的输出参数构成整体模型;步骤S205中,按照方差越大则该子模型权重越小的原则构造出高斯型权函数在步骤S205中,重复步骤S201/S202/S203和S204计x次,可以得到x个子模型对应的高斯型权函数和预测系数betax,分别对x个模型求取预测系数的加权函数,第i个子模型的权函数为:采用集成学习的思想,构造整体模型的预测系数newbeta,其计算方式如下:newbeta=diag(W)*betax其中diag(W)由各个子模型权函数wi构成的对角矩阵;步骤S105,利用稳健性强的整体定量校正模型结合预测集样本完成定量建模。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院合肥物质科学研究院,未经中国科学院合肥物质科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710589783.5/,转载请声明来源钻瓜专利网。