[发明专利]一种利用随机森林进行业务分类的方法在审
申请号: | 202010269379.1 | 申请日: | 2020-04-08 |
公开(公告)号: | CN111428808A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 韩周安;尹森林 | 申请(专利权)人: | 成都爱科特科技发展有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/12 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 袁英 |
地址: | 610000 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 随机 森林 进行 业务 分类 方法 | ||
1.一种利用随机森林进行业务分类的方法,其特征在于,包括以下步骤:
S1.收集M个业务集及其所具有的参数集{gi,i=1,2,……n};
S2.设置需要的分类参数集{hi,i=1,2,……n},共i个;并设置分类参数;
S3.通过袋装算法Bagging生成k个样本业务集;
S4.通过k个样本业务集,产生k个分类树,并通过基尼指数对业务集进行划分,将具有最小基尼指标的参数作为该节点的分裂指标。
2.根据权利要求1所述的一种利用随机森林进行业务分类的方法,其特征在于,所述的步骤S2的分类参数,通过业务具有的特征进行设置。
3.根据权利要求1所述的一种利用随机森林进行业务分类的方法,其特征在于,所述的步骤S3,包括以下子步骤:
S301.设定所需生成的样本业务集数量k个;
S302.从M个业务集中独立地、随机地、有放回地抽取m个数据,形成一个新的样本业务集;
S303.重复步骤S301,产生多个独立的样本业务集;直至生成k个样本业务集。
4.根据权利要求3所述的一种利用随机森林进行业务分类的方法,其特征在于,所述的抽取的数据数量m小于收集的业务集数量M。
5.根据权利要求1所述的一种利用随机森林进行业务分类的方法,其特征在于,所述的步骤S4,根据k个样本业务集,产生k个分类树,包括以下子步骤:
S401.在分类树的每个内部节点处从{hi,i=1,2,……n}分类参数集中随机挑选mtry个参数作为候选参数;
S402.按照节点不纯度最小的原则从步骤S401所述的mtry个候选参数中选择一个最优参数对节点进行分裂生长;
S403.通过每棵分类树充分生长直到每个叶子节点的不纯度达到最小。
6.根据权利要求5所述的一种利用随机森林进行业务分类的方法,其特征在于,所述的最优参数,通过基尼指数进行选择,具体为:
基尼指标的定义如下:
其中表示参数j在节点处t的概率;
当在业务集划分为m个部分时的基尼指数为:
其中,m是子节点的数目,ni是子节点i处的样本数,n是母节点处的样本数;
通过计算,将具有最小基尼指标的参数作为该节点的分裂指标。
7.根据权利要求5所述的一种利用随机森林进行业务分类的方法,其特征在于,所述的候选的数量mtry不能大于母节点处的样本数n。
8.根据权利要求1所述的一种利用随机森林进行业务分类的方法,其特征在于,所述的步骤S4,当构建分类树结束后,还包括步骤S5,通过多个分类树的分类器,对下一时刻的业务进行预测,下一时刻的业务通过每个分类树分类器的投票结果的简单多数投票法决定,具体为:
通过分类树分类,每棵分类树的最后一个节点都包含有之前分类时的参数信息;可定义n棵分类树中的第j棵分类树为hj(j=1,2,3...n),下一时刻的业务分类为c的概率为采用多数投票法确定类别c←arg maxP(c|x),得出下一时刻的业务,信道通过该预测结果进行划分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都爱科特科技发展有限公司,未经成都爱科特科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010269379.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种明装安装装置,以及设备组合
- 下一篇:一种管道带压开孔装置