[发明专利]一种小麦突变体识别方法在审
申请号: | 202010648667.8 | 申请日: | 2020-07-07 |
公开(公告)号: | CN111929270A | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 徐延浩;曾玉婷;王容;刘录祥;张文英;陈功海 | 申请(专利权)人: | 长江大学 |
主分类号: | G01N21/3563 | 分类号: | G01N21/3563;G06K9/62 |
代理公司: | 武汉蓝宝石专利代理事务所(特殊普通合伙) 42242 | 代理人: | 严超 |
地址: | 434000*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 小麦 突变体 识别 方法 | ||
本发明提供一种小麦突变体识别方法,该方法包括:收集小麦籽粒的红外光谱,将红外光谱数据按比例分为训练集和预测集;对训练集和预测集中的红外光谱数据进行预处理后,基于红外光谱数据的特征吸收峰波数和特征吸收波段,对随机森林模型和判别分析模型进行训练;根据训练后的随机森林模型和判别分析模型的准确率,筛选最佳预处理方式;基于最佳预处理方式,以及随机森林模型输出的最佳判别波段,确定突变体类型,并基于最佳判别波段通过判别分析模型鉴别对应的小麦突变体。通过该方案解决了现有小麦突变体识别方法准确率低且需要的样本量大的问题,可以减少样本需求,无损快速对样本进行处理,同时突变体识别准确率高。
技术领域
本发明涉及计算机应用领域,尤其涉及一种小麦突变体识别方法。
背景技术
随着人们对高抗性淀粉、纤维、花青素、籽粒锌元素含量等特异品质小麦材料需求越来越强烈。诱变育种技术是种质资源创新,新基因挖掘和新品种选育的一个重要途径。目前,诱变技术已经在高抗性淀粉、籽粒高锌元素含量等特异小麦材料创制上显示出了重要价值。但由于诱变的随机性,在育种实践中有效突变产生概率仅为10-3-10-5。因此,突变体的筛选是制约诱变技术的发展的瓶颈之一],亟需开发快速、准确又有效的技术手段或方法。
现有的突变体鉴别方法有形态学鉴定、离体筛选和分子筛选等,但这些方法存在成本高、破坏样本及结果不准确等的问题。随着红外光谱预测技术应用,实际在对突变体识别过程中可以实现对样品无损、快速检测,然而当前红外技术谱带宽重叠严重难以准确区分突变体,通常用于OH、NH、CH等基团的定量分析,且近红外光谱测定需要的样品量较大,只适用于稳定株系的品质性状筛选。
发明内容
有鉴于此,本发明实施例提供了一种小麦突变体识别方法,以解决现有基于红外光谱的小麦突变体识别方法准确率低且样本量大的问题。
在本发明实施例的第一方面,提供了一种小麦突变体识别方法,包括:
收集小麦籽粒的红外光谱,将红外光谱数据按预定比例分为训练集和预测集;
对训练集和预测集中的红外光谱数据进行预处理后,分别基于训练集中红外光谱数据的特征吸收峰波数和特征吸收波段,对随机森林模型和判别分析模型进行训练;
根据训练后的随机森林模型和判别分析模型的准确率,筛选最佳预处理方式;
基于最佳预处理方式,通过训练后的随机森林模型识别待测小麦红外光谱数据的最佳判别波段,确定突变体类型,并基于最佳判别波段通过判别分析模型鉴别对应的小麦突变体。
在一个实施例中,所述预处理方式包括基线校正-纵坐标归一化、基线校正-纵坐标归一化-二阶导数谱、基线校正-纵坐标归一化-自动平滑、基线校正-纵坐标归一化-自动平滑-一阶导数谱和基线校正-纵坐标归一化-自动平滑-二阶导数谱。
在一个实施例中,训练后的随机森林模型以及最佳红外光谱预处理方法在不同波段对判别分析模型的影响,筛选所述判别分析模型的最佳建模波段。
在一个实施例中,计算待测小麦突变体与对照突变体之间的马氏距离,采用Origin绘制小麦籽粒突变体判别分析模型二维图,基于判别分析模型二维图将待测小麦突变体与对照突变体重新聚类,区分真实突变体对应的光谱数据。
本发明实施例中,收集小麦籽粒的红外光谱,将红外光谱数据按预定比例分为训练集和预测集;
对训练集和预测集中的红外光谱数据进行预处理后,分别基于训练集中红外光谱数据的特征吸收峰波数和特征吸收波段,对随机森林模型和判别分析模型进行训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长江大学,未经长江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010648667.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种瓦楞纸板生产用折叠机
- 下一篇:一种语音分割点的确定方法和装置