[发明专利]一种基于改进决策树对新类型进行预测的方法在审

专利信息
申请号: 201811236238.9 申请日: 2018-10-24
公开(公告)号: CN109214594A 公开(公告)日: 2019-01-15
发明(设计)人: 付川云;张济宁;李雅洁;肖玉曼 申请(专利权)人: 西南交通大学
主分类号: G06Q10/04 分类号: G06Q10/04
代理公司: 暂无信息 代理人: 暂无信息
地址: 610000 四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 决策树 预测集 决策树模型 预测 训练集 改进 构造决策 数据特征 特征类型 树模型
【权利要求书】:

1.一种基于改进决策树对新类型进行预测的方法,其特征在于,其包括:

构造决策树模型,将预测集特征作为输入进行预测,得到预测集的最终等级;

得到预测的最终等级包括以下步骤:

S101:判断预测集的数据特征类型是否已存在于训练集;

S102:若特征类型已存在于训练集,基于训练出的决策树模型判断其等级;若不存在,通过改进的决策树模型判断预测集数据特征的等级,判断过程为用训练数据集的特征对新特征进行替换,若替换后的特征在训练数据中有所对应,则判定出新特征与用于替换的特征为同等级。

2.根据权利要求1所述的一种基于改进决策树对新类型进行预测的方法,其特征在于,上述步骤S102中,通过改进的决策树模型判断其等级包含以下步骤:

步骤A1:输入新类型a;

步骤A2:找出新类型a中新的特征值;

步骤A3:找出该特征值上一叶子节点的特征和该特征值,分别记为M和m;

步骤A4:替换新类型a中的特征M的特征值,得到类型b;

步骤A5:判断类型b在决策树中是否存在,若不存在则返回步骤A4,若存在则进行下一步;

步骤A6:判断替换后的叶子节点下,有无与替换后的类型b等级相同的类型c,若不存在则返回步骤A4,若存在,则进行下一步;

步骤A7:将类型c的特征M的特征值替换为m,得到类型d,判断d是否存在,若不存在则返回步骤A4,若存在,则进行下一步;

步骤A8:新类型a的等级就等于类型d的等级。

3.根据权利要求1~2任一项所述的一种基于改进决策树对新类型进行预测的方法,其特征在于,构造决策树模型包括以下过程:

对训练样本进行数据分析,提取训练样本数据集特征;

以训练样本数据的等级作为输出,利用提取特征基于决策树进行训练,构造决策树模型。

4.根据权利要求3所述的一种基于改进决策树对新类型进行预测的方法,其特征在于,上述对利用提取特征基于决策树进行训练包括以下步骤:

S201:对数据进行预处理;

S202:在决策树内部节点,从m个特征中根据香农熵最小的原则选取一个特征作为划分依据;

S203:用该特征对数据集进行划分;

S204:对下一节点重复步骤202至步骤203,直至节点的特征被消耗完或节点数据所有类别都相同;

S205:节点无法继续划分,决策树构建完毕。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学,未经西南交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811236238.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top