[发明专利]漏洞分类方法、装置、设备及介质在审
申请号: | 202111381657.3 | 申请日: | 2021-11-17 |
公开(公告)号: | CN114117445A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 郑天文;王竟成;王辉;林承军 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F21/57 | 分类号: | G06F21/57;G06K9/62 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 赵婷 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 漏洞 分类 方法 装置 设备 介质 | ||
本公开提供了一种漏洞分类方法、装置、设备、存储介质和程序产品,用于识别补丁文件修复的漏洞类型,可以应用于人工智能技术领域。该漏洞分类方法包括:获取待识别的第一补丁文件;按照预处理规则提取所述第一补丁文件中的第一更新代码片段;按照预定的向量转换规则将所述第一更新代码片段中的代码处理为第一向量;以及以所述第一向量作为预训练好的漏洞分类模型的输入,基于所述漏洞分类模型输出的漏洞分类结果,确定所述第一补丁文件所修复的漏洞类型。本公开还提供了一种训练漏洞分类模型的方法、装置、设备、存储介质和程序产品。
技术领域
本公开涉及人工智能领域,更具体地涉及一种用于识别补丁文件修复的漏洞类型的漏洞分类方法、装置、设备、介质和程序产品。
背景技术
漏洞分类是进行漏洞管理的基础。目前的漏洞管理普遍依赖公共漏洞数据库(例如,国际安全组织维护的公共漏洞数据库)中的数据,例如,通过对公共漏洞数据库中的漏洞数据的统计、分析或学习,可以掌握当前出现的各种类型漏洞的分布、每种漏洞的特点、或者学习漏洞代码的特点以帮助发现程序代码中是否有漏洞等。然而公共漏洞数据库中的漏洞数据的录入和维护成本较高,而且漏洞数据从收录到公开有一定的周期,并且公共漏洞数据库中收录的数据的范围受限于数据库维护方的选择或权限,数据范围比较局限,从而会导致可供分析使用的漏洞数据集具有滞后性、数据不充分等问题。
发明内容
鉴于上述问题,本公开实施例提供了一种漏洞分类方法、装置、设备、介质和程序产品,以及训练漏洞分类模型的方法、装置、设备、介质和程序产品,可以提高可供分析使用的漏洞数据集的实时性,扩大可学习的漏洞数据集的数据范围。
本公开实施例的第一方面,提供了一种漏洞分类方法。所述漏洞分类方法用于识别补丁文件修复的漏洞类型。所述方法包括:获取待识别的第一补丁文件;按照预处理规则提取所述第一补丁文件中的第一更新代码片段,其中,所述第一更新代码片段是基于所述第一补丁文件相比于其所修复的原代码文件发生变化的代码得到的;按照预定的向量转换规则将所述第一更新代码片段中的代码处理为第一向量;以及以所述第一向量作为预训练好的漏洞分类模型的输入,基于所述漏洞分类模型输出的漏洞分类结果,确定所述第一补丁文件所修复的漏洞类型。
根据本公开的实施例,所述按照预处理规则提取所述第一补丁文件中的第一更新代码片段包括:从所述第一补丁文件中,删除相比于其所修复的原代码文件发生变化的更改行以外的文本行,以保留所述更改行中的代码;以及对所述更改行中的代码进行规范化处理,得到所述第一更新代码片段。
根据本公开的实施例,所述按照预定的向量转换规则将所述第一更新代码片段中的代码处理为第一向量包括:基于所述第一更新代码片段中的词序列,得到第一字典变量;以及按照预定义的映射函数中每个词的索引值,将所述第一字典变量中的每个词转换为对应的索引值,以生成所述第一向量。
根据本公开的实施例,所述映射函数是对训练所述漏洞分类模型所使用的数据集中的词生成索引值而得到的。
根据本公开的实施例,所述漏洞分类模型是通过如下方式训练得到的:获取已知修复的漏洞类型的N个第二补丁文件,其中,N为大于或等于1的整数;按照所述预处理规则提取每个所述第二补丁文件中的第二更新代码片段,其中,所述第二更新代码片段是基于所述第二补丁文件相比于其所修复的原代码文件发生变化的代码得到的;按照所述向量转换规则将所述第二更新代码片段中的代码处理为第二向量;以每个所述第二补丁文件对应的漏洞类型的信息作为所述第二补丁文件对应的所述第二向量的标签,得一个样本数据;其中,N个所述第二补丁文件对应得到N个所述样本数据;以及利用N个所述样本数据组成的数据集,训练所述漏洞分类模型。
根据本公开的实施例,所述漏洞分类模型包括BERT模型。
根据本公开的实施例,所述漏洞分类模型输出的漏洞分类结果用于表示以下任意一种漏洞类型:未修复漏洞、权限验证漏洞、代码注入漏洞、跨站脚本攻击漏洞、溢出漏洞、信息泄露漏洞或输入校验漏洞。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111381657.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:立式水性漆回转喷涂装置
- 下一篇:一种光纤编码复刻与测量一体化系统