[发明专利]一种利用随机森林进行业务分类的方法在审

专利信息
申请号: 202010269379.1 申请日: 2020-04-08
公开(公告)号: CN111428808A 公开(公告)日: 2020-07-17
发明(设计)人: 韩周安;尹森林 申请(专利权)人: 成都爱科特科技发展有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06Q50/12
代理公司: 成都金英专利代理事务所(普通合伙) 51218 代理人: 袁英
地址: 610000 四川省*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 利用 随机 森林 进行 业务 分类 方法
【说明书】:

发明公开了一种利用随机森林进行业务分类的方法,包括以下步骤:S1.收集M个业务集及其所具有的参数集;S2.设置需要的分类参数集,共i个;S3.通过袋装算法Bagging生成k个样本业务集;S4.通过k个样本业务集,产生k个分类树,并通过基尼指数对业务集进行划分,将具有最小基尼指标的参数作为该节点的分裂指标。本发明通过随机森林算法,采用袋装算法实现样本集随机抽取;产生可以对业务集大且分类参数较多的分类与预测,并实现叶子结点纯度达到最大。

技术领域

本发明涉及计算机领域,尤其涉及一种利用随机森林进行业务分类的方法。

背景技术

分类树是决策树(Decision tree)的分类方法的一种,通过构建二叉树方法进行目的预测,也称分类决策树。分类树采用自顶向下的递归方法,根据信息的特征差异进行分裂,直至每个叶子纯度达到最大。

目前分类树大部分用于对业务集进行分类,通过Bagging算法,对业务集进行多轮训练,提高分类的稳定性,再通过采用投票的方式,对测试样本类别进行预测。但是这种传统利用分类树对业务进行分类的方法,往往会因为样本类别过多,导致出现分类错误的情况。

现有技术中存在以下缺陷:

(1)对于业务集数量较大的系统,往往会出现无法实现准确、合理、深层次分类;

(2)部分分类树没有采用袋装算法,导致样本集不是通过随机抽取的方式产生的;

(3)对于参数较多的分类时,往往会出现分类错误。

发明内容

本发明的目的在于,针对上述问题,提出一种利用随机森林进行业务分类的方法。

本发明的发明目的是通过以下技术方案实现的:一种利用随机森林进行业务分类的方法,包括以下步骤:

S1.收集M个业务集及其所具有的参数集{gi,i=1,2,……n};

S2.设置需要的分类参数集{hi,i=1,2,……n},共i个;并设置分类参数;

S3.通过袋装算法Bagging生成k个样本业务集;

S4.构建分类树。

其中,所述的步骤S2的分类参数,通过业务具有的特征进行设置;

所述的步骤S3,包括以下子步骤:

S301.设定所需生成的样本业务集数量k个;

S302.从M个业务集中独立地、随机地、有放回地抽取m个数据,形成一个新的样本业务集;

S303.重复步骤S301,产生多个独立的样本业务集;直至生成k个样本业务集。所述的步骤S4,一个样本业务集用于构建一颗分类树,k个样本业务集则产生k个分类树,包括以下子步骤:

S401.在分类树的每个内部节点处从{hi,i=1,2,……n}分类参数集中随机挑选mtry个参数作为候选参数(mtryn);

S402.按照节点不纯度最小的原则从步骤S401所述的mtry个候选参数中选择一个最优参数对节点进行分裂生长;

S403.通过每棵分类树充分生长直到每个叶子节点的不纯度达到最小。所述的最优参数,通过基尼指数进行选择,具体为:

基尼指标的定义如下:

其中的是参数j在节点处t的概率;

当在业务集划分为m个部分时的基尼指数为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都爱科特科技发展有限公司,未经成都爱科特科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010269379.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top