[发明专利]一种近红外光谱分析中的异常样本识别方法在审
申请号: | 201710123913.6 | 申请日: | 2017-03-03 |
公开(公告)号: | CN106596465A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 王艳;尹艳玲;沈维政;孙红敏;李晓明 | 申请(专利权)人: | 东北农业大学 |
主分类号: | G01N21/359 | 分类号: | G01N21/359 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150030 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 红外 光谱分析 中的 异常 样本 识别 方法 | ||
1.一种近红外光谱分析中的异常样本识别方法,其特征在于:
步骤1:改变半数重采样算法的结果表达方式;
步骤2:利用改变后的半数重采样算法对原始光谱数据进行异常样本识别,选择最佳置信区间;
步骤3:利用Cook距离方法对化学值数据进行异常样本识别,选择最佳置信区间;
步骤4:作样本散点图,判断特异样本;
步骤5:将散点图左上方区域、右下方区域样本点标记为异常样本点。
2.如权利要求1所述的一种近红外光谱分析中的异常样本识别方法,其特征在于步骤1中改变半数重采样算法的结果表达方式的具体方法为:原算法中,每次采样后利用置信区间选取异常样本,对选择的异常样本进行计数累加,选取累加数最多的样本为异常样本;新方法改为每次采样后对计算得到的半数重采样距离进行累加,之后对累加的数据按照置信区间,选取最终的异常样本数据,改变后的算法在尝试选取最佳置信区间方面具有明显优势。
3.如权利要求1所述的一种近红外光谱分析中的异常样本识别方法,其特征在于步骤2、步骤3中最佳置信区间的方法为:首先选取置信区间范围,针对每个置信区间,选取距离大的样本为异常样本,去除异常样本后建立偏最小二乘模型,依据预测模型的校正集均方根误差最小选择最佳置信区间。
4.如权利要求1所述的一种近红外光谱分析中的异常样本识别方法,其特征在于步骤4中作样本散点图,判断特异样本的具体方法为:以样本的Cook距离值为横坐标,半数重采样距离为纵坐标,作所有样本的散点图;以步骤2和步骤3中的最佳置信区间值划分散点图区域,计算位于右上方区域的样本点的光谱数据杠杆值,若杠杆值高,则为标记为异常样本点,否则该样本为特异样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北农业大学,未经东北农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710123913.6/1.html,转载请声明来源钻瓜专利网。