[发明专利]一种基于烟叶致香成分的多模型评价烟叶原料相似度的方法有效
申请号: | 201611162141.9 | 申请日: | 2016-12-15 |
公开(公告)号: | CN106645530B | 公开(公告)日: | 2018-07-24 |
发明(设计)人: | 高锐;杨威;宋鹏飞;王毅;李文均;李艳琼;肖敏;张光煦;马迅 | 申请(专利权)人: | 云南中烟工业有限责任公司 |
主分类号: | G01N30/86 | 分类号: | G01N30/86 |
代理公司: | 昆明正原专利商标代理有限公司 53100 | 代理人: | 金耀生;于洪 |
地址: | 650231 *** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 烟叶原料 相似度 烟叶 样本 成分数据 马氏距离 模型评价 验证集 原料库 烟草技术领域 计算相似度 数据信息 随机选取 烟叶样品 差异性 经验证 数据组 训练集 采样 建模 验证 分析 | ||
本发明涉及一种基于烟叶致香成分的多模型评价烟叶原料相似度的方法,属于烟草技术领域。本发明的方法是通过蒙特卡洛无放回采样,随机选取一定比例的样本作为训练集,剩下的样本作为模型内部验证集;建立多个基于烟叶致香成分含量的主成分模型;利用内部验证集样本对模型的有效性进行验证;将新烟叶原料的致香成分数据输入经验证有效的主成分模型,计算样品在多个模型中的马氏距离,对生成的马氏距离数据组进行分析,评价新的烟叶原料与原料库中烟叶原料的相似度。本发明与一次建模计算相似度方法相比较,更能充分提取所有样品致香成分数据信息,也更能兼顾原料库中烟叶样品致香成分含量的差异性数据信息。
技术领域
本发明涉及一种基于烟叶致香成分的多模型评价烟叶原料相似度的方法,属于烟草技术领域。具体是以某一品牌卷烟涉及烟叶原料的致香成分为基础数据,通过构建烟叶原料相似度多模型评价体系,实现新烟叶原料与原库中烟叶原料相似度评价,为挑选合适烟叶进入原料库,维护烟叶原料库供需平衡,保持同一品牌卷烟的风格特征提供辅助信息。
背景技术
面对国内外烟草消费市场的新形势,“卷烟上水平”已成为我国烟草行业发展的基本方针和战略任务。“卷烟上水平”就必须保证烟叶原料供应上水平,以品牌为导向的烟叶原料配置在烟叶原料供应上水平中发挥着重要的作用。品牌导向的烟叶原料配置就需要为同一品牌的卷烟配置特用的烟叶原料库。当烟叶库存用完,进行烟叶原料替代时需要选择与替代样品感官评吸相似度高,又与其它烟叶原料的感官相似度高的烟叶样品,以保持同一品牌卷烟在抽吸风格特征上的一致性。
烟叶致香成分的种类和含量是卷烟风格特征的物质基础。中国专利CN201210388661采用卷烟的致香物含量进行逐步回归分析,建立了卷烟香型的定量化判定标准。中国专利CN201310551840通过对烟叶特征化学指标的筛选和取舍,然后进行主成分计算,建立了烟叶风格特征TQ的计算公式。上述两个专利揭示了烟叶致香成分在保持卷烟风格特征方面发挥着重要作用。因此如何保持新挑选的烟叶原料必须与原料库中烟叶原料在致香成分含量整体性上较高的相似度就显得尤为重要。
中国专利CN200810030798基于烟叶的化学成分,采用主成分分析和马氏距离搜索评价相似烟叶。中国专利CN201210344034基于烟叶的近红外信息,采用主成分分析和马氏距离判定相似烟叶样品,辅助卷烟配方。上述两个专利揭示了主成分分析能从整体性上较好的揭示多维烟草化学成分分析的整体性信息,马氏距离能有效的计算两个未知样本集的相似度。
以上技术中,采用一次建模的主成分分析和马氏距离计算和评价烟叶样本相似度,存在以下不足:由于主成分模型中各样本间存在一定的差异性,将所有样品进行一次性建模难以排除与其它样品差异性较大的个别样品对主成分分析模型整体性的影响。一次性建模所采用的训练集难以完全代表所有样本的总体信息。
蒙特卡洛采样是一种无放回采样,也称刀切法(Jack knife),机选取一定比例的样本作为训练集,剩下的样本作为独立测试集。进行蒙特卡洛采样时需要设定采样次数、训练集和内部验证集样品个数的比例划分。蒙特卡洛采样能较好兼顾数据的整体性信息和差异性信息。
马氏距离的计算公式: ,式中:为平均得分矩阵,为马氏矩阵M的逆矩阵, 。 为样本集中
发明内容
本发明的目的在于建立一种基于烟叶致香成分的多模型评价烟叶原料相似度的方法。本发明的意义在于:弥补一次建模的不足,使烟叶原料相似度评价更加科学和合理。
本发明的方法是通过蒙特卡洛无放回采样,随机选取一定比例的样本作为训练集,剩下的样本作为模型内部验证集;建立多个基于烟叶致香成分含量的主成分模型;利用内部验证集样本对模型的有效性进行验证;将新烟叶原料的致香成分数据输入经验证有效的主成分模型,计算样品在多个模型中的马氏距离,对生成的马氏距离数据组进行分析,评价新的烟叶原料与原料库中烟叶原料的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南中烟工业有限责任公司,未经云南中烟工业有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611162141.9/2.html,转载请声明来源钻瓜专利网。