[发明专利]一种基于决策树的IP应用场景划分方法有效
申请号: | 202110540989.5 | 申请日: | 2021-05-18 |
公开(公告)号: | CN113411205B | 公开(公告)日: | 2023-02-28 |
发明(设计)人: | 王永;田占奎;姜耀铠;戚伟;魏明亮 | 申请(专利权)人: | 郑州埃文计算机科技有限公司 |
主分类号: | H04L41/044 | 分类号: | H04L41/044;H04L41/0813;H04L41/147;H04L41/14;H04L41/0823;G06F18/2431;G06N3/045;G06N3/08;G06N20/20 |
代理公司: | 郑州意创知识产权代理事务所(特殊普通合伙) 41138 | 代理人: | 张江森;侯喜立 |
地址: | 450000 河南省郑州市经济技术开发区*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 决策树 ip 应用 场景 划分 方法 | ||
1.一种基于决策树的IP应用场景划分方法,其特征在于:包括
步骤1、获取并将IP样本数据集D划分为IP样本训练集、IP样本验证集和IP样本测试集,并构造可微的遗忘决策树;
步骤2、训练若干棵树的每一个基本的树结构中的参数,并得到若干各不同参数的树模型;
步骤3、构建深层网络结构并获得最终IP应用场景预测结果;
步骤4、获取未知场景样本的特征并输入模型,得到样本属于各个类别的概率值,将概率最大的类别作为IP应用场景预测结果输出。
2.根据权利要求1所述的基于决策树的IP应用场景划分方法,其特征在于:步骤1中,将传统的决策树加以限制,得到遗忘决策树,并对遗忘决策树中每个决策结点的划分方法进行支持端到端的优化改进,根据训练集对遗忘决策树中的参数进行初始化,得到M棵相同的初始化完成的遗忘决策树。
3.根据权利要求1所述的基于决策树的IP应用场景划分方法,其特征在于:步骤2中,将训练集随机划分成多个小批次,每一棵遗忘决策树使用不同的小批次数据集和数据集中随机的特征进行训练,保证集成结构中遗忘决策树的多样性;同时每颗遗忘决策树进行多次训练并通过随机梯度下降调整参数,保证其分类能力,并最终得到若干各不相同的拥有良好参数的树模型。
4.根据权利要求1所述的基于决策树的IP应用场景划分方法,其特征在于:步骤3中,将M棵树模型的输出与步骤1中的训练集进行拼接得到新的训练集;将得到的新的训练集用于新的M棵可微遗忘决策树模型的训练,得到新的M棵拥有良好参数的树模型;重复上述两个线性过程,得到多层网络结构,最终预测结果为每层输出的平均值。
5.根据权利要求2所述的基于决策树的IP应用场景划分方法,其特征在于:数据集中一个样本x×y代表一个IP地址的实例,x代表特征,y代表该样本的真实场景类别;一个决策树包括若干决策结点d∈D和若干叶结点l∈L,每个叶结点维护着一个样本x关于每个类别y的概率分布hl={hl1,hl2,hl3,hl4},其中,hlj代表样本x的场景属于i类的概率;
每个决策结点上由一个二值的划分函数sd(x,Θ)=σ(fn(x;Θ))来确定样本的决策路线,其中,x代表某个特定的样本,Θ是一个可学习的参数,fn(x;Θ)是一个由样本x和参数Θ共同决定的输出数值的函数;
以相同层的划分函数s保持一致作为约束条件对决策树进行约束,得到遗忘决策树,最终样本x在树T的在类别y的概率输出HT如下式:
其中,h=hl∈L为所有叶结点l的概率分布,hly代表在类别y上的概率,pl(x|Θ)为样本x到达叶结点l的概率,pl(x|Θ)计算如下:
其中,1(·)是指示函数,Lleft和Lright分别代表决策结点向左和向右的路线,至此,得到可微的遗忘决策树。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州埃文计算机科技有限公司,未经郑州埃文计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110540989.5/1.html,转载请声明来源钻瓜专利网。