[发明专利]一种基于自组织神经网络的近红外光谱共识模型的构建方法在审
申请号: | 201810857472.7 | 申请日: | 2018-07-31 |
公开(公告)号: | CN109060715A | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 陈孝敬;李理敏;石文;袁雷明 | 申请(专利权)人: | 温州大学 |
主分类号: | G01N21/359 | 分类号: | G01N21/359;G06K9/62 |
代理公司: | 温州名创知识产权代理有限公司 33258 | 代理人: | 陈加利 |
地址: | 325000 浙江省温州市瓯海*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 自组织神经网络 近红外光谱 权重系数 样本集 构建 近红外光谱数据 偏最小二乘回归 预处理 矩阵 定量模型 聚类结果 模型算法 信息变量 样本光谱 预测结果 参考 鲁棒性 有机物 预测集 建模 聚类 光谱 应用 采集 | ||
本发明公开了一种基于自组织神经网络的近红外光谱共识模型的构建方法,包括以下操作:选取n个样本,测定某一有机物样本参考值,采集样本的近红外光谱数据,记为矩阵X,对X进行预处理得到Xpre,应用自组织神经网络聚类方法将光谱变量聚成4类。根据聚类结果建立4组样本集,分别对样本集进行划分,使用样本集中3n/4的样本作为建模集,剩余n/4样本作为预测集,建立偏最小二乘回归模型;计算预测结果与参考值之间的误差,再应用共识模型算法计算出4个子模型权重系数w1、w2、w3和w4,并基于权重系数对4个子模型进行变量共识,得到定量模型。本发明的有益效果是本发明的有益效果是不仅合理的利用了样本光谱信息变量,而且提升了模型的准确性和鲁棒性。
技术领域
本发明涉及化学计量学和光谱学领域,特别涉及一种基于自组织神经网络的近红外光谱共识模型的构建方法。
背景技术
虽然近红外光谱技术是一种方便、简单的快速检测技术,其具有无损、安全、样品无需预处理、不需有毒有害化学试剂等特点,已经成为当前最有前景和应用最广泛的快速检测技术之一。但由于近红外光谱信息具有高维性,通常具有成百上千个变量,里面包含了大量的冗余,共线性,甚至无用的变量信息。因此通常需要对光谱数据进行变量选择,然后基于的最优变量建立定量模型,以此来提升模型的鲁棒性和预测精度。
通常所采用的变量选择方法有遗传算法、连续投影算法、无信息变量消除法、竞争性自适应重采样法等算法,这些算法虽然可以获取最有用的变量,但在选择最优变量的同时不进去除了许多冗余变量,但与此同时也去除了许多含有少数信息的有益变量,因此选出的少数最优变量很可能不足以充分的表达出总体的光谱信息,而且许多变量选择方法选出的变量个数不能超过样本个数,否则无法有效的建立定量检测模型,因此存在丢失过多变量信息的问题。
发明内容
本发明要解决的技术问题是提出一种合理利用样本光谱信息变量,且提升了模型的准确性和鲁棒性的基于自组织神经网络变量选择的近红外光谱共识模型算法。
为解决上述技术问题,本发明是通过以下技术方案实现的:一种基于自组织神经网络的近红外光谱共识模型的构建方法,包括以下步骤:
步骤1,选取n个样本,n为小于100的正整数,通过标准化学方法测定某一有机物样本参考值,记为列向量Y;
步骤2,采集n个样本m维近红外光谱数据X;
步骤3,对光谱数据进行预处理,处理后的数据计为Xpre;
步骤4,应用自组织神经网络变量聚类方法进行光谱变量聚类,将变量按照变量相互之间相似性聚成4类,每类含有变量个数分别为a、b、c、d,其中a+b+c+d=m;
步骤5,基于变量聚类结果建立含有n个样本,含有a、b、c、d个变量的4组样本集Za、Zb、Zc和Zd;
步骤6,分别对Za、Zb、Zc和Zd 4组样本集数据进行划分,其中3n/4的样本作为建模集,剩余n/4样本做为预测集,然后建立4个偏最小二乘回归模型;计算4组预测结果与参考值之间的误差,而后应用共识模型算法计算出4个子模型权重系数w1、w2、w3、w4;权重系数的计算公式为:
步骤7,基于权重系数w1、w2、w3、w4对4个子模型进行变量共识,得到定量模型,变量共识计算公式为:
f(x)=∑kwkfk(x)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学,未经温州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810857472.7/2.html,转载请声明来源钻瓜专利网。