[发明专利]一种基于太赫兹时域光谱的芝麻油品种识别方法在审
申请号: | 202010603814.X | 申请日: | 2020-06-29 |
公开(公告)号: | CN111693484A | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 武国芳;吕明;葛宏义;张元 | 申请(专利权)人: | 河南工业大学 |
主分类号: | G01N21/3586 | 分类号: | G01N21/3586;G01N21/3577 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 450001 河南省郑州市高新技*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 赫兹 时域 光谱 芝麻油 品种 识别 方法 | ||
1.本发明公布了一种用于芝麻油品种鉴别的方法,包括以下步骤:
(1)数据预处理:将太赫兹光谱仪测得的光谱数据进行预处理,由于在测量过程中受到环境因素的影响,需要将测得的数据进行预处理,因为后面波段受到的干扰较大,所以选取0~2.5 THz范围内的波形进行观测,并采用归一化预处理的方式对计算所得的吸收系数进行预处理;
(2)特征提取:原始数据为580维,直接使用SVM分类效率会比较低,所以先采用PCA进行特征提取,最终保留前4个主成分,使用前4个主成分代替原始数据集,作为SVM分类模型的输入;数据将进行以下流程:
A.原始数据组成矩阵将样本去中心化,为方便表示仍用X表示去中心化后的矩阵;
B.计算协方差矩阵
C.计算协方差矩阵的特征值和特征向量
构造特征方程:
计算得特征值和特征向量,
D.将特征值降序排序得
E.选择4个最大的特征值对应的特征向量构建到新空间中
前4个特征值对应得特征向量为,组成矩阵,新的样本矩阵为
(3)PCA-SVM分类:采用PCA-SVM联用模型对样品进行分类,先对原始数据集进行划分,训练集和测试集的比例为7 : 3,为了得到更好的分类效果,实验采用网格搜索算法得出分类准确率最高的参数组合,主要对核函数(kernel)、惩罚函数(C)、核函数系数(γ)进行搜索,最佳分类效果的参数为惩罚函数C为0.01,核函数系数γ为0.1,整个流程如下:
A.使用Origin软件处理原始数据,将太赫兹仪器检测得到的光谱数据导入到Origin中,画出时域图,然后进行傅里叶变换得到频谱图,输入吸收系数和折射率的公式进行计算得到相应的吸收系数和折射率;
B.使用Spyder软件进行建模分析,将Origin中处理得到的数据输入到PCA-SVM模型中,使用网格搜索算法寻取最优参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南工业大学,未经河南工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010603814.X/1.html,转载请声明来源钻瓜专利网。