[发明专利]基于决策树的作物育种评价方法有效
申请号: | 201510347717.8 | 申请日: | 2015-06-19 |
公开(公告)号: | CN104951987B | 公开(公告)日: | 2018-04-10 |
发明(设计)人: | 赵向宇;刘忠强;王书锋;潘守慧;王志彬;王开义 | 申请(专利权)人: | 北京农业信息技术研究中心 |
主分类号: | G06Q50/02 | 分类号: | G06Q50/02 |
代理公司: | 北京路浩知识产权代理有限公司11002 | 代理人: | 李相雨 |
地址: | 100097 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于决策树的作物育种评价方法,该方法包括以育种目标为筛选条件,构建作物育种评价数据集,所述数据集共享相同的育种目标,其中,所述数据集中的每个数据均以四元数据类型{实验材料编号,性状特征集合T,所属实验e,实验结果r}来表示;对所述数据集中的性状特征集合T进行预处理,得到预处理后的数据集;根据所述预处理后的数据集,使用决策树构建性状特征与实验结果间的模型,得到针对育种目标的基于决策树的作物育种评价模型;根据所述作物育种评价模型对具有相同育种目标的待评价作物性状数据进行分析,并获得评价结果。上述方法能利用育种过程中的评价结果信息,以实现后续的作物育种的评价。 | ||
搜索关键词: | 基于 决策树 作物 育种 评价 方法 | ||
【主权项】:
一种基于决策树的作物育种评价方法,其特征在于,包括:以育种目标为筛选条件,构建作物育种评价数据集,所述数据集共享相同的育种目标,其中,所述数据集中的每个数据均以四元数据类型{实验材料编号,性状特征集合T,所属实验e,实验结果r}来表示;对所述数据集中的性状特征集合T进行预处理,得到预处理后的数据集;根据所述预处理后的数据集,使用决策树构建性状特征与实验结果间的模型,得到针对育种目标的基于决策树的作物育种评价模型;根据所述作物育种评价模型对具有相同育种目标的待评价作物性状数据进行分析,并获得评价结果;所述根据所述预处理后的数据集,使用决策树构建性状特征与实验结果间的模型,得到针对育种目标的基于决策树的作物育种评价模型,包括:S1、将预处理后的数据集记为D0,D0中的特征集合记为T0,根据D0与T0生成根节点root,并令所述根节点root作为当前节点;S2、根据第三公式,计算得到D0的基尼Gini指标;S3、判断D0是否小于预设阈值G且T0中性状的个数是否为0,若D0小于预设阈值且T0中性状的个数为0,则将当前节点标记为叶子节点,取Pi中的最大值对应的实验结果ri为该节点的实验结果;若D0大于等于预设阈值且T0中性状的个数不为0,则执行步骤S4‑S7;S4、计算T0中各性状特征与实验结果的排序相关性;S5、取T0中与实验结果排序相关性最大的性状特征作为当前节点的划分性状Ts;S6、根据划分性状Ts计算划分阈值vs,并根据vs将D0划分为两个集合D1、D2;S7、从T0中移除Ts,分别令D1、D2作为D0,重复S2至S7建立其对应的决策树模型,并将结果分别作为当前节点的左、右子树;其中,所述第三公式为:Gini(D0)=1-Σi=1aPi2]]>其中,a为所述实验结果r中不同取值的个数,Pi为D0中数据对应实验结果ri的概率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京农业信息技术研究中心,未经北京农业信息技术研究中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510347717.8/,转载请声明来源钻瓜专利网。