[发明专利]一种基于熵优化支持向量机的漏洞自动分类方法在审
申请号: | 202110243504.6 | 申请日: | 2021-03-05 |
公开(公告)号: | CN113010673A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 李轲;罗飞;白光磊 | 申请(专利权)人: | 中标软件有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F21/57 |
代理公司: | 北京汇智英财专利代理事务所(普通合伙) 11301 | 代理人: | 张俊阁 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 优化 支持 向量 漏洞 自动 分类 方法 | ||
1.一种基于熵优化支持向量机的漏洞自动分类方法,其特征在于包括步骤
S1:构建漏洞分类模型;
S2:训练漏洞分类模型;以及
S2:完善漏洞分类模型。
2.根据权利要求1所述的一种基于熵优化支持向量机的漏洞自动分类方法,其特征在于步骤S1包括:
S11检测漏洞:根据CVE漏洞数据库得到漏洞的编号、类别和描述,形成暴露列表;
S12收集漏洞信息:将暴露列表转换为机器语言,得到漏洞信息;
S13预处理:对漏洞信息进行粗提取,得到漏洞文本特征词;
S14根据漏洞文本特征词分析获取特征权重,使用向量空间模型表示漏洞训练样本,得到漏洞分类模型。
3.根据权利要求2所述的一种基于熵优化支持向量机的漏洞自动分类方法,其特征在于:S13中,粗提取包括对漏洞信息执行分词和清除噪音数据处理,得到漏洞文本特征词的过程。
4.根据权利要求2所述的一种基于熵优化支持向量机的漏洞自动分类方法,其特征在于:S14中,基于信息增益的方法提取漏洞文本特征词的特征子集,确定特征子集中的各个特征项的特征权重。
5.根据权利要求2所述的一种基于熵优化支持向量机的漏洞自动分类方法,其特征在于:S14中,基于文档频率、x2统计的方法提取漏洞文本特征词的特征子集,确定特征子集中的各个特征项的特征权重。
6.根据权利要求2所述的一种基于熵优化支持向量机的漏洞自动分类方法,其特征在于:步骤S2包括分析漏洞训练样本,通过熵优化支持向量机的分类算法对漏洞训练样本进行训练。
7.根据权利要求6所述的一种基于熵优化支持向量机的漏洞自动分类方法,其特征在于:步骤S3包括分析训练结果,使用预定的评估指标对分类算法进行评估。
8.根据权利要求7所述的一种基于熵优化支持向量机的漏洞自动分类方法,其特征在于:该评估指标包括准确率。
9.根据权利要求8所述的一种基于熵优化支持向量机的漏洞自动分类方法,其特征在于,确定该准确率的公式为:
其中,TPi表示理论上属于CVE漏洞数据库中的类别Ci的且被正确分类的漏洞数量;FPi表示理论上不属于类别Ci的,经过支持向量机分类后判别到Ci的漏洞数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中标软件有限公司,未经中标软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110243504.6/1.html,转载请声明来源钻瓜专利网。