[发明专利]一种基于光谱线性表示的油品性质预测方法有效
申请号: | 201711166539.4 | 申请日: | 2017-11-21 |
公开(公告)号: | CN107958267B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 焦一平;费树岷;陈夕松 | 申请(专利权)人: | 东南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G01N21/359;G01N21/3577 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 楼高潮 |
地址: | 210000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 光谱 线性 表示 油品 性质 预测 方法 | ||
本发明具体涉及一种基于光谱线性表示的油品性质预测方法;对校正集及测试样本的近红外光谱数据进行主成分分析,提取主成分分析得到的得分矩阵中前k个主成分建立主成分空间,并在主成分空间中基于欧式距离寻找到与测试样本最近的n个校正集中的油品样本,称为邻近样本;计算邻近样本的近红外光谱权值w;利用近红外光谱权值w对邻近样本的性质值进行加权,即得到测试样本的性质值预测。本发明通过具有特定权值的线性组合对测试样本进行预测,结合了参数模型和非参数模型的优势。
技术领域
本发明属于石油化工的油品性质检测领域,具体涉及一种基于光谱线性表示的油品性质预测方法。
背景技术
传统油品评价方法可以提供详细的原油性质数据,但其操作复杂,时间长,很难满足油品加工过程中对油品性质分析实时性的要求。目前,基于近红外光谱的建模技术趋于成熟,这些方法包括多元线性回归、局部加权回归、偏最小二乘等,并广泛应用于油品的性质预测。尽管这些方法已经开始考虑利用局部建模的思想来处理实际问题中存在的非线性,但其线性参数模型的本质仍然限制了模型的预测性能,且其计算相对复杂,也有较多需要调节的参数。
基于拓扑聚类等非参数的模型,如k近邻法,能够适用于非线性问题且计算、调参相对于参数模型更为简便。但这些方法并没有充分利用输入信息,对数据的处理过于简单,欠缺对输入数据精细的考虑,使得其难以处理较为精确的预测问题。近红外光谱建模问题具有较强的非线性,且其输入数据为油品的波数段近红外吸光度数据,蕴含了大量的信息,这对传统的参数模型和非参数模型提出了挑战。
因此,亟待对基于拓扑学的方法进行改进。
发明内容
针对前述传统油品评价方法的缺陷而提出的一种基于光谱线性表示的油品性质预测方法,本发明基于邻近样本,通过将其进行具有特定权值的线性组合对测试样本进行预测,结合了参数模型和非参数模型的优势。
为了实现上述发明目的,本发明采用了以下技术方案:
一种基于光谱线性表示的油品性质预测方法,包括以下步骤:
1)首先对校正集及测试样本的近红外光谱数据进行主成分分析,提取主成分分析得到的得分矩阵的前k个主成分建立主成分空间,并在主成分空间中基于欧式距离寻找到与测试样本最近的n个校正集中的油品样本,称为邻近样本;
2)计算邻近样本的近红外光谱权值w,所述w加权线性组合与测试样本的近红外光谱之差的二范数最小,且w加权线性组合与测试样本的近红外光谱的和值为1;
3)利用近红外光谱权值w对邻近样本的性质值进行加权,即得到测试样本的性质值预测。
进一步,在对新的待测样本进行预测时,所述校正集由油品样本库中所有样本组成。
进一步,所述欧式距离di的表达公式如下:
其中pi,j为校正集第i个油品样本近红外光谱数据在第j个主成分上的得分,p0,j为测试样本近红外光谱数据在第j个主成分上的得分,k为主成分数。在求得了di后,即可寻找到{di}中最小的n个。在校正集近红外光谱数据Xall、性质数据Yall中提取对应的油品样本,即可构成邻近样本的近红外光谱数据表Xneighbor与性质列表Yneighbor(为叙述简便,分别将其记为X与Y)。
进一步,所述k通过主成分分析中方差累积贡献率达到指定值予以确定或选取k=2或k=3。
进一步,所述近红外光谱权值w通过解正则化优化问题得到:
s.t. 1Tw=1
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711166539.4/2.html,转载请声明来源钻瓜专利网。