[发明专利]一种漏洞识别方法、装置、设备和存储介质在审
申请号: | 202110814335.7 | 申请日: | 2021-07-19 |
公开(公告)号: | CN113343248A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 毛杭清;林钱雷;尤永健;常敏强 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G06F21/57 | 分类号: | G06F21/57;G06F40/30;G06K9/62 |
代理公司: | 北京信远达知识产权代理有限公司 11304 | 代理人: | 刘晓菲 |
地址: | 101299 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 漏洞 识别 方法 装置 设备 存储 介质 | ||
本申请实施例公开了一种漏洞识别方法、装置、设备和存储介质,将目标识别文本输入到漏洞识别模型,就能得到目标识别文本中的漏洞信息的识别结果,该漏洞识别模型是利用多个标注漏洞信息的目标训练文本进行训练得到的。由此可见,本申请实施例可以利用训练得到的漏洞识别模型,快速的识别目标识别文本中的漏洞信息,相较于技术人员逐条查看目标识别文本的漏洞信息,利用漏洞识别模型识别目标识别文本的漏洞信息效率更高。
技术领域
本申请涉及计算机领域,尤其涉及一种漏洞识别方法、装置、设备和存储介质。
背景技术
当前,随着计算机技术的发展,向用户提供多种服务的程序也越来越多。但是程序可能会在向用户提供服务的过程中出现漏洞。
在一些场景下,用户可以对使用程序过程中遇到的问题进行反馈,这些问题的反馈包括有关程序漏洞的反馈。技术人员通过对用户的反馈进行逐条查看,从而获得有关程序的漏洞信息,以进行相应的处理。可见,这种漏洞识别的方法效率较低。
发明内容
为了解决现有技术中漏洞识别效率低的问题,本申请实施例提供一种漏洞识别方法、装置、设备和存储介质,能够提高漏洞识别的效率。
本申请实施例提供一种漏洞识别方法,所述方法包括:
获取目标识别文本;
将所述目标识别文本输入到漏洞识别模型,得到识别结果,所述识别结果用于指示所述目标识别文本中的漏洞信息,所述漏洞识别模型根据目标训练文本集合训练得到,所述目标训练文本集合包括多个标注所述漏洞信息的目标训练文本。
可选地,所述识别结果用于指示所述目标识别文本中的漏洞信息包括:
所述识别结果用于指示所述目标识别文本是否描述有漏洞,所述漏洞识别模型根据标注是否描述有漏洞的目标训练文本训练得到;或,
所述识别结果用于指示所述目标识别文本中描述的漏洞的类型,所述漏洞识别模型根据标注所述漏洞的类型的目标训练文本训练得到。
可选地,所述方法还包括:
获取多个候选训练文本;
将所述多个候选训练文本中的每个候选训练文本分别转换为对应的向量;
对所述多个候选训练文本对应的向量进行聚类,得到聚类结果;
根据所述聚类结果从所述多个候选训练文本中确定出所述目标训练文本集合。
可选地,所述聚类结果包括聚类中心集合,所述聚类中心集合包括通过聚类得到的一个或多个类别的聚类中心;所述候选训练文本包括第一候选训练文本;
所述根据所述聚类结果从所述多个候选训练文本中确定出所述目标训练文本集合包括:
确定所述第一候选训练文本的向量与所述聚类中心集合中与所述第一候选训练文本的向量最接近的聚类中心之间的距离;
响应于所述距离小于或等于第一阈值,将所述第一候选训练文本确定为所述目标训练文本。
可选地,所述方法还包括:
获取候选训练文本集合,所述候选训练文本集合包括标注的漏洞信息相同的一个或多个候选训练文本,所述一个或多个候选训练文本包括第一候选训练文本;
确定所述候选训练文本集合中包括的候选训练文本的数目;
当所述数目小于或等于第二阈值时,将所述候选训练文本集合中的第一候选训练文本进行复制,得到一个或多个复制训练文本;将所述一个或多个候选训练文本以及所述一个或多个复制训练文本加入所述目标训练文本集合;或,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110814335.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种果醋、果醋饮料及其制备方法
- 下一篇:一种地下连续墙成槽平台