[发明专利]一种基于遗传算法自适应选择分段点的红外光谱PLS建模方法有效
申请号: | 201310194197.2 | 申请日: | 2013-05-22 |
公开(公告)号: | CN103411913A | 公开(公告)日: | 2013-11-27 |
发明(设计)人: | 陈孝敬;黄光造;管晓春 | 申请(专利权)人: | 温州大学 |
主分类号: | G01N21/35 | 分类号: | G01N21/35 |
代理公司: | 杭州杭诚专利事务所有限公司 33109 | 代理人: | 王江成 |
地址: | 325035 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及红外光谱分析技术领域,具体是一种能提高PLS建模效果的数据处理方法,解决了红外光谱分段PLS建模过程中难以选择合适分段点的问题。本方法利用遗传算法自适应得到样本的分段组合,具体步骤为:(1)根据遗传算法,对采集到的红外光谱样本进行合适的编码;(2)设置目标函数函数;(3)根据遗传算法,得到优化的样本组合;(4)根据最终的样本组合,进行分段PLS建模。现本发明提供了一种不需要数据分布的先验知识,通过遗传算法自适应的找到合适的分段点的方法,操作简单,速度快。 | ||
搜索关键词: | 一种 基于 遗传 算法 自适应 选择 分段 红外 光谱 pls 建模 方法 | ||
【主权项】:
一种基于遗传算法自适应选择分段点的红外光谱PLS建模方法,其特征在于,包括以下步骤:步骤一,样品的划分,每种类别准备多个不同的样品数据,每种类别的样品划分为三部分SET1,SET2,SET3,SET1用于分段模型的建立,SET2用于分段模型的测试,SET3用于最终分段模型的验证,由SE T1构成的矩阵为校正集,由SET2构成的矩阵为预测子集,由SET3构成的矩阵为独立预测集;步骤二,设置Y变量的值,如果有n种类别,则这些类别的Y变量的值分别设置为1,2,3,…n,如有6种类别,则Y变量的值设置为1,2,3,4,5,6;步骤三,对校正集样品做主成分分析,得到一个得分矩阵Sc、投影方向矩阵T和每列平均值构成的行矩阵M;步骤四,创建初始种群:包括设置个体每位的进制数,代表最大的分段数p,如分p段则采用p进制,如p=3,表示个体每位有0,1,2这3种取值可能;设置个体的长度n,代表类别数,即Crom矩阵的列数;设置种群的大小v,代表一个种群内个体的数量,即Crom矩阵的行数,如p=3,n=6,v=4,随机产生的初始种群如下所示: Crom = 1 1 1 1 1 1 1 1 1 2 2 2 1 1 0 0 2 2 1 0 0 0 0 0 a b c d e f a,b,c,d,e,f表示类别,Crom矩阵的每一行对应一个个体,个体的每一位数字对应一种类别,分别对应a,b,c,d,e,f这6种类别,数字相同的类别归为一段,第一行[1 1 1 1 1 1]表示,a,b,c,d,e,f归为一段,即不分段的形式,第二行[1 1 1 2 2 2]表示a,b,c三类归为一段,d,e,f归为一段,一共只出现两种不同的数字,即全部类别分为两段,第三段[1 1 0 0 2 2],表示a,b归为一段,c,d归为一段,e,f归为一段,一共出现三种不同的数字,即全部类别共分为三段,Crom矩阵对应的Y变量矩阵如下所示, Y = 1 2 3 4 5 6 a b c d e f Y变量矩阵是建立PLS模型的因变量的值;步骤五,对初始种群的每个个体代表的模型进行建模,方法如下:对矩阵的每一行数据,先看每个数字出现的次数,如果存在多种不同的数字而有个数字只出现一次,则这个模型的目标函数值直接设为一个较大的值,接着再判断是不是全部数字都一样的情况,如果是则将所有类别归为一段,建立相应的回归模型,回归方程的自变量矩阵就是全部的校正集样品的红外光谱数据,因变量矩阵就是全部的校正集样品的因变量值,每类样品的因变量的设置值如Y矩阵所示,用所求的回归方程模型求得预测子集样品的因变量的值,从而判断其类别,目标函数是预测子集样品的误判数,如果是其它的情况,则从0开始,用数字相同的类别建立相应的分段回归模型1:包括相应的PLS方程和类别信息矩阵,回归方程的自变量矩阵就是归为同一段的校正 集样品的红外光谱数据,因变量矩阵就是这些样品对应的Y变量值,类别信息矩阵就是归为同一段的校正集样品的红外光谱数据做主成分分析后的得分,接着寻找标号为1的数字,重复建模的动作,建立分段回归模型2,依次类推,直到所有的样本都划分完毕,求这个模型的目标函数值,方法如下:先求测试样品数据的得分,再求得分和各个类别信息矩阵的马氏距离,然后把该测试样品数据带入马氏距离最小的分段回归模型,求出预测值,如果该测试样本不属于马氏距离最小的分段回归模型,则该样本定位错误,所有预测子集样品都预测完毕,通过和真实的Y变量的值进行比较,得到测试集样品的误判数,记录测试集样品定位错误数,目标函数值为误判数和样品定位错误数之和,所有个体的目标函数值构成一个列矩阵F;步骤六,根据目标函数值矩阵F,种群,由遗传算法的相关操作得到下一代种群;步骤七,判断遗传是否终止,是的话选出这代种群中目标函数值最小的个体,这个就是遗传算法选中的最终分段模型,否的话,回到步骤六;步骤八,遗传过程结束,构造遗传算法找的的最优的模型;步骤九,将独立预测集的样本代入最终的模型,算出误判数W1,和普通PLS模型的误判数W2进行比较,如果W1比W2小则接受这个新模型,否则还是采用普通PLS模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学,未经温州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310194197.2/,转载请声明来源钻瓜专利网。
- 上一篇:可转位式球头立铣刀
- 下一篇:含增压器的溴化锂吸收式热泵及控制方法