[发明专利]基于随机森林的策略自学习和优化方法及装置有效
申请号: | 201711171060.X | 申请日: | 2017-11-21 |
公开(公告)号: | CN107948149B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 刘博;范渊;杨锦峰;聂桂兵 | 申请(专利权)人: | 杭州安恒信息技术股份有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L12/24 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 梁斌 |
地址: | 310000 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 随机 森林 策略 自学习 优化 方法 装置 | ||
1.一种基于随机森林的策略自学习和优化方法,其特征在于,包括:
确定目标安全策略的正确率,其中,所述正确率用于表示所述目标安全策略对网络应用服务进行安全性判定时的准确程度;
判断所述正确率是否小于预设调优阈值;
在所述正确率小于所述预设调优阈值的情况下,采用随机森林算法将所述目标安全策略的原始安全策略模型进行优化,得到优化之后的安全策略模型,从而完成所述目标安全策略的优化。
2.根据权利要求1所述的方法,其特征在于,采用随机森林算法将所述目标安全策略的原始安全策略模型进行优化,得到优化之后的安全策略模型,包括:
获取所述目标安全策略的策略特征、判定结果和标注结果,其中,所述判定结果为所述目标安全策略判定网络应用服务是否安全的结果,所述标注结果为对所述判定结果是否正确进行标注的结果;
由所述策略特征、所述判定结果和所述标注结果构建样本数据,得到多个样本数据;
通过使用多个所述样本数据的随机森林算法确定所述优化后的安全策略模型。
3.根据权利要求2所述的方法,其特征在于,通过使用多个所述样本数据的随机森林算法确定优化后的安全策略模型,包括:
在多个所述样本数据中进行有放回的随机抽样,分别得到第一样本组、第二样本组和第三样本组;
通过所述第一样本组构建随机森林的模型,其中,所述随机森林的模型中包括多个决策树,一个所述决策树由所述第一样本组中的一个样本数据构建;
通过所述第二样本组对所述随机森林的模型参数进行训练,得到安全策略初始模型;
通过所述第三样本组对所述安全策略初始模型进行验证,确定所述优化后的安全策略模型。
4.根据权利要求3所述的方法,其特征在于,通过所述第三样本组对所述安全策略初始模型进行验证,确定所述优化后的安全策略模型,包括:
将所述第三样本组导入所述安全策略初始模型中,验证所述安全策略初始模型对网络应用服务的安全性判定结果是否正确;
在所述安全性判定结果不正确的情况下,对所述随机森林的模型参数进行调整;
在所述安全性判定结果正确的情况下,将所述安全策略初始模型确定为所述优化后的安全策略模型。
5.根据权利要求2所述的方法,其特征在于,所述策略特征包括:访问所述网络应用服务的时间、访问所述网络应用服务的流量、访问所述网络应用服务的频率、访问所述网络应用服务的域名和访问所述网络应用服务的会话初始协议。
6.根据权利要求1所述的方法,其特征在于,确定目标安全策略的正确率,包括:
从网络应用的日志中采集所述目标安全策略、所述目标安全策略的判定结果和所述目标安全策略的标注结果,其中,所述判定结果为所述目标安全策略判定网络应用服务是否安全的结果,所述标注结果为对所述判定结果是否正确进行标注的结果;
计算目标判定结果的数量与所述判定结果的总数量之间的比值,并将所述比值确定为所述目标安全策略的正确率,其中,所述目标判定结果为标注结果为正确的判定结果。
7.一种基于随机森林的策略自学习和优化装置,其特征在于,包括:
第一确定模块,用于确定目标安全策略的正确率,其中,所述正确率用于表示所述目标安全策略对网络应用服务进行安全性判定时的准确程度;
判断模块,用于判断所述正确率是否小于预设调优阈值;
第二确定模块,用于在所述正确率小于所述预设调优阈值的情况下,采用随机森林算法将所述目标安全策略的原始安全策略模型进行优化,得到优化之后的安全策略模型,从而完成所述目标安全策略的优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州安恒信息技术股份有限公司,未经杭州安恒信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711171060.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种模拟代填的方法及装置
- 下一篇:报文转发方法及装置