[发明专利]一种基于改进决策树对新类型进行预测的方法在审
申请号: | 201811236238.9 | 申请日: | 2018-10-24 |
公开(公告)号: | CN109214594A | 公开(公告)日: | 2019-01-15 |
发明(设计)人: | 付川云;张济宁;李雅洁;肖玉曼 | 申请(专利权)人: | 西南交通大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 决策树 预测集 决策树模型 预测 训练集 改进 构造决策 数据特征 特征类型 树模型 | ||
1.一种基于改进决策树对新类型进行预测的方法,其特征在于,其包括:
构造决策树模型,将预测集特征作为输入进行预测,得到预测集的最终等级;
得到预测的最终等级包括以下步骤:
S101:判断预测集的数据特征类型是否已存在于训练集;
S102:若特征类型已存在于训练集,基于训练出的决策树模型判断其等级;若不存在,通过改进的决策树模型判断预测集数据特征的等级,判断过程为用训练数据集的特征对新特征进行替换,若替换后的特征在训练数据中有所对应,则判定出新特征与用于替换的特征为同等级。
2.根据权利要求1所述的一种基于改进决策树对新类型进行预测的方法,其特征在于,上述步骤S102中,通过改进的决策树模型判断其等级包含以下步骤:
步骤A1:输入新类型a;
步骤A2:找出新类型a中新的特征值;
步骤A3:找出该特征值上一叶子节点的特征和该特征值,分别记为M和m;
步骤A4:替换新类型a中的特征M的特征值,得到类型b;
步骤A5:判断类型b在决策树中是否存在,若不存在则返回步骤A4,若存在则进行下一步;
步骤A6:判断替换后的叶子节点下,有无与替换后的类型b等级相同的类型c,若不存在则返回步骤A4,若存在,则进行下一步;
步骤A7:将类型c的特征M的特征值替换为m,得到类型d,判断d是否存在,若不存在则返回步骤A4,若存在,则进行下一步;
步骤A8:新类型a的等级就等于类型d的等级。
3.根据权利要求1~2任一项所述的一种基于改进决策树对新类型进行预测的方法,其特征在于,构造决策树模型包括以下过程:
对训练样本进行数据分析,提取训练样本数据集特征;
以训练样本数据的等级作为输出,利用提取特征基于决策树进行训练,构造决策树模型。
4.根据权利要求3所述的一种基于改进决策树对新类型进行预测的方法,其特征在于,上述对利用提取特征基于决策树进行训练包括以下步骤:
S201:对数据进行预处理;
S202:在决策树内部节点,从m个特征中根据香农熵最小的原则选取一个特征作为划分依据;
S203:用该特征对数据集进行划分;
S204:对下一节点重复步骤202至步骤203,直至节点的特征被消耗完或节点数据所有类别都相同;
S205:节点无法继续划分,决策树构建完毕。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学,未经西南交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811236238.9/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理