[发明专利]漏洞分类方法、装置、设备及介质在审
申请号: | 202111381657.3 | 申请日: | 2021-11-17 |
公开(公告)号: | CN114117445A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 郑天文;王竟成;王辉;林承军 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F21/57 | 分类号: | G06F21/57;G06K9/62 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 赵婷 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 漏洞 分类 方法 装置 设备 介质 | ||
1.一种漏洞分类方法,用于识别补丁文件修复的漏洞类型,其中,所述方法包括:
获取待识别的第一补丁文件;
按照预处理规则提取所述第一补丁文件中的第一更新代码片段,其中,所述第一更新代码片段是基于所述第一补丁文件相比于其所修复的原代码文件发生变化的代码得到的;
按照预定的向量转换规则将所述第一更新代码片段中的代码处理为第一向量;以及
以所述第一向量作为预训练好的漏洞分类模型的输入,基于所述漏洞分类模型输出的漏洞分类结果,确定所述第一补丁文件所修复的漏洞类型。
2.根据权利要求1所述的方法,其中,所述按照预处理规则提取所述第一补丁文件中的第一更新代码片段包括:
从所述第一补丁文件中,删除相比于其所修复的原代码文件发生变化的更改行以外的文本行,以保留所述更改行中的代码;以及
对所述更改行中的代码进行规范化处理,得到所述第一更新代码片段。
3.根据权利要求2所述的方法,其中,所述按照预定的向量转换规则将所述第一更新代码片段中的代码处理为第一向量包括:
基于所述第一更新代码片段中的词序列,得到第一字典变量;以及
按照预定义的映射函数中每个词的索引值,将所述第一字典变量中的每个词转换为对应的索引值,以生成所述第一向量。
4.根据权利要求3所述的方法,其中,所述映射函数是对训练所述漏洞分类模型所使用的数据集中的词生成索引值而得到的。
5.根据权利要求1所述的方法,其中,所述漏洞分类模型是通过如下方式训练得到的:
获取已知修复的漏洞类型的N个第二补丁文件,其中,N为大于或等于1的整数;
按照所述预处理规则提取每个所述第二补丁文件中的第二更新代码片段,其中,所述第二更新代码片段是基于所述第二补丁文件相比于其所修复的原代码文件发生变化的代码得到的;
按照所述向量转换规则将所述第二更新代码片段中的代码处理为第二向量;
以每个所述第二补丁文件对应的漏洞类型的信息作为所述第二补丁文件对应的所述第二向量的标签,得一个样本数据;其中,N个所述第二补丁文件对应得到N个所述样本数据;以及
利用N个所述样本数据组成的数据集,训练所述漏洞分类模型。
6.根据权利要求1~5任意一项所述的方法,其中,所述漏洞分类模型包括BERT模型。
7.根据权利要求1~5任意一项所述的方法,其中,所述漏洞分类模型输出的漏洞分类结果用于表示以下任意一种漏洞类型:
未修复漏洞、权限验证漏洞、代码注入漏洞、跨站脚本攻击漏洞、溢出漏洞、信息泄露漏洞或输入校验漏洞。
8.一种训练漏洞分类模型的方法,其中,所述漏洞分类模型用于对补丁文件修复的漏洞类型进行分类,所述方法包括:
获取已知修复的漏洞类型的N个第二补丁文件,其中,N为大于或等于1的整数;
按照预处理规则提取每个所述第二补丁文件中的第二更新代码片段,其中,所述第二更新代码片段是基于所述第二补丁文件相比于其所修复的原代码文件发生变化的代码得到的;
按照预定的向量转换规则将所述第二更新代码片段中的代码处理为第二向量;
以每个所述第二补丁文件对应的漏洞类型的信息作为所述第二补丁文件对应的所述第二向量的标签,得一个样本数据;其中,N个所述第二补丁文件对应得到N个所述样本数据;以及
利用N个所述样本数据组成的数据集,训练所述漏洞分类模型。
9.根据权利要求8所述的方法,其中,所述获取已知修复的漏洞类型的N个第二补丁文件包括:
确定需要进行漏洞分类识别的软件清单;以及
获取所述软件清单中每个软件对应的至少一个所述第二补丁文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111381657.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:立式水性漆回转喷涂装置
- 下一篇:一种光纤编码复刻与测量一体化系统