[发明专利]一种确定偏最小二乘回归潜变量数的方法在审
申请号: | 201711122113.9 | 申请日: | 2017-11-14 |
公开(公告)号: | CN109783772A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 张辞海;彭黔荣;胡芸;刘娜 | 申请(专利权)人: | 贵州中烟工业有限责任公司 |
主分类号: | G06F17/18 | 分类号: | G06F17/18 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 550001*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练集 稳定性参数 子模型 偏最小二乘回归 交互验证法 回归系数 测试集 采集 预测 记录 | ||
1.一种确定偏最小二乘回归潜变量数的方法,其特征在于,包括:
计算各潜变量数对应的稳定性参数;
确定所述稳定性参数最大时对应的潜变量数为最优潜变量数;
其中,计算潜变量数对应的稳定性参数具体包括:
基于采集到的样品,采用交互验证法选择N个子训练集和与之一一对应的N个子测试集;其中,所述N为正整数;
利用各所述子训练集建立当前潜变量数对应的子模型,并利用与所述子训练集对应的子模型对与所述子训练集对应的子测试集进行预测;
记录每个所述子模型的回归系数,并根据每个所述子模型的回归系数计算得到所述潜变量数对应的稳定性参数。
2.根据权利要求1所述的方法,其特征在于,所述计算各潜变量数对应的稳定性参数具体包括:
按从小到大的顺序排列各所述潜变量数;
从最小的潜变量数开始,依次计算各所述潜变量数对应的稳定性参数并比较所述稳定性参数与上一次计算得到的稳定性参数的大小,直到稳定性参数连续减小的次数大于阈值为止。
3.根据权利要求1所述的方法,其特征在于,还包括:
计算各所述潜变量数对应的决定系数;
相应的,结合所述稳定性参数与所述决定系数确定所述最优潜变量数;
其中,计算潜变量数对应的决定系数具体为根据测试得到的每个所述子测试集的预测值与每个所述子测试集的真值计算得到所述潜变量数对应的决定系数。
4.根据权利要求1所述的方法,其特征在于,还包括:
计算各所述潜变量数对应的交互验证均方根误差;
相应的,结合所述稳定性参数与所述交互验证均方根误差确定所述最优潜变量数;
其中,计算潜变量数对应的交互验证均方根误差具体为根据测试得到的每个所述子测试集的预测值与每个所述子测试集的真值计算得到所述潜变量数对应的交互验证均方根误差。
5.根据权利要求1所述的方法,其特征在于,所述交互验证法具体为蒙特卡洛交互验证法。
6.根据权利要求1所述的方法,其特征在于,所述采集样品具体为:
采集所述样品的分析数据和成分含量数据。
7.根据权利要求6所述的方法,其特征在于,所述分析数据具体为近红外光谱数据。
8.根据权利要求6所述的方法,其特征在于,所述分析数据具体为紫外光谱数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州中烟工业有限责任公司,未经贵州中烟工业有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711122113.9/1.html,转载请声明来源钻瓜专利网。