[发明专利]一种基于决策树的作物育种信息测定系统及方法在审
申请号: | 201910624674.1 | 申请日: | 2019-07-11 |
公开(公告)号: | CN110378591A | 公开(公告)日: | 2019-10-25 |
发明(设计)人: | 刘鹏飞;蒋锋;陈青春;张姿丽;李小琴;万小荣;孙伟;余锋;李武;刘君;湛东武 | 申请(专利权)人: | 仲恺农业工程学院 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/02;G06K9/62 |
代理公司: | 重庆市信立达专利代理事务所(普通合伙) 50230 | 代理人: | 陈炳萍 |
地址: | 510225 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 决策树 作物育种 信息测定 育种 决策树构建 分析模块 育种评价 分类处理模块 数据采集模块 信息处理技术 决策树模型 检索模块 模型训练 数据分析 显示模块 置信区间 主控模块 状况评估 准确度 云存储 准确率 分析 | ||
1.一种基于决策树的作物育种信息测定方法,其特征在于,所述基于决策树的作物育种信息测定方法包括:
第一步,利用采集设备采集育种数据信息;
第二步,对采集到的育种数据信息进行预处理,利用分类程序对采集的育种数据进行分类;
第三步,利用构建程序构建育种评价决策树;
第四步,利用分析程序对育种数据进行分析;利用检索程序检索育种数据信息;
第五步,利用云服务器对采集的育种数据进行存储;
第六步,利用显示器显示采集的育种数据、评价信息、分析结果、检索数据。
2.如权利要求1所述的基于决策树的作物育种信息测定方法,其特征在于,所述基于决策树的作物育种信息测定方法对采集到的育种数据信息进行预处理具体包括:将采集到的育种数据分为正向指标数据、负向指标数据以及适中数据分别处理:
其中,zij表示第i个育种材料的第j个性状的原始值,yij表示第i个育种材料的第j个性状标准化后的值;max(Zj)为Z中第j列的最大值;min(Zj)为Z中第j列的最小值;Δij=|zij-cj|,cj为Z中第j列的理想值;
当指标j为正向或负向指标,并且max(Zj)=min(Zj)时,令yij=0;当指标j为适中指标,并且max{Δ1j,Δ2j,…Δmj}为0时,令yij=1。
3.如权利要求1所述的基于决策树的作物育种信息测定方法,其特征在于,所述基于决策树的作物育种信息测定方法评价决策树构建方法如下:
(1)通过构建程序提取育种评价大数据中70%的数据,作为育种评价决策树的训练样本,根据所述训练样本的信息增益率,确定所述育种评价决策树的分枝变量;所述训练样本的信息增益率包括:
其中,a为生命特征属性;Gain_ratio为选择生命特征属性a作为分裂属性的训练样本的信息增益率;D为育种评价决策树的训练样本;Gain为选择生命特征属性a作为分裂属性的信息增益;IV为a的信息熵;Ent为D的信息熵;Di为按照生命特征属性a对D进行划分,产生V个分支节点,其中第i个分支节点包含了D中所有在a上取值为ai的育种评价决策树的训练样本数目;pk为D中第k类样本所占的比例;y为D中样本的种类数;
(2)获取育种评价决策树的验证样本,根据所述验证样本,对所述分枝变量进行后剪枝,得到最终的育种评价决策树;
根据所述验证样本,对所述分枝变量进行后剪枝,得到最终的育种评价决策树,包括:采用置信区间法,通过正太分布表获取单个节点的育种评价结果误差,针对所述单个节点的父节点,获取所述父节点下属所有子节点的育种评价结果误差,进一步获取所述所有子节点的育种评价结果误差的加权值,若所述加权值大于所述父节点的育种评价结果误差,且所述单个节点的育种评价结果误差为最小值,则将所述父节点下属所有子节点修剪剔除。
4.如权利要求1所述的基于决策树的作物育种信息测定方法,其特征在于,所述基于决策树的作物育种信息测定方法对育种数据分析方法包括:
1)通过分析程序根据构建的评价决策树提取至少两个有对应关系的数据作为数据组,并提取数据组的信息熵;
2)循环执行1)直至大数据库中大于阈值数量的数据都使用过;
3)对数据组进行聚类分析,将同一类型的数据组划入决策树的同一层,使得多层决策树的层级关系明确;设置聚类密度和聚类半径;所述聚类半径对应数据组的信息熵;
4)以层级关系明确后的多层决策树对新加入的数据进行分析;将新加入的数据填入决策树的第一层;根据决策树的层级关系将数据映射入决策树的下一层;重复执行上步直至数据抵达决策树的最后一层;以决策树最后一层的结果作为数据分析的最终结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于仲恺农业工程学院,未经仲恺农业工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910624674.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理