[发明专利]知识图谱构建方法、CWE社区描述方法以及存储介质在审
申请号: | 202211645595.7 | 申请日: | 2022-12-17 |
公开(公告)号: | CN116108847A | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 孙基栩;司红星;秦少华 | 申请(专利权)人: | 四维创智(北京)科技发展有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/284;G06F21/57;G06N3/08;G06N3/0464 |
代理公司: | 北京维正专利代理有限公司 11508 | 代理人: | 刘晓刚 |
地址: | 100089 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 构建 方法 cwe 社区 描述 以及 存储 介质 | ||
1.一种知识图谱构建方法,其特征在于,所述方法包括:
对多个漏洞分析文章的内容进行实体识别,得到文章实体;
基于所述文章实体、CWE实体、CAPEC实体和CVE实体,构建所述知识图谱的实体列表;
根据所述文章中的漏洞名,在所述文章实体与所述CVE实体之间建立映射关系;
根据所述CVE实体中的CWE_ID,在所述CVE实体与所述CWE实体之间建立映射关系;
根据所述CAPEC实体中的CWE_ID,在所述CAPEC实体与所述CWE实体之间建立映射关系,从而完成所述知识图谱的构建。
2.根据权利要求1所述的知识图谱构建方法,其特征在于,
所述文章实体的属性包括:文章标题、文章内容和文章的可读性;
所述CWE实体为CWE数据集中的漏洞,所述CWE实体的属性包括:名称和描述信息;
所述CAPEC实体为CAPEC数据集中的漏洞,所述CAPEC实体的属性包括:名称、描述信息、攻击收益、攻击难度和对应的CWE_ID;
所述CVE实体为CVE数据集中的漏洞,所述CVE实体的属性包括:名称、攻击收益向量、攻击组件向量、CVSS评分和对应的CWE_ID。
3.根据权利要求2所述的知识图谱构建方法,其特征在于,
所述文章的可读性包括:复现漏洞层面的可读性、漏洞执行层面的可读性、补丁和缓解措施层面的可读性、漏洞分析层面的可读性,以及文章长度的可读性。
4.一种CWE社区描述方法,其特征在于,所述方法包括:
获取预设数量的漏洞分析文章;
基于所述漏洞分析文章,利用权利要求1-3中任一项所述的知识图谱构建方法,构建知识图谱;
根据所述知识图谱,从攻击收益角度出发将所述知识图谱中的所述CWE实体划分为若干个CWE社区;
根据所述知识图谱确定所述漏洞分析文章与所述CWE社区的对应关系;
基于训练好的卷积神经网络,将每个所述漏洞分析文章分类为综述文章或详细描述文章;
基于LDA主题抽取模型,根据预设的主题数量对每个所述漏洞分析文章进行主题抽取;
根据每个所述CWE社区对应的所述漏洞分析文章的分类和主题,分别对每个所述CWE社区进行标准化描述。
5.根据权利要求4所述的CWE社区描述方法,其特征在于,
所述根据所述知识图谱确定所述漏洞分析文章与所述CWE社区的对应关系,包括:
根据所述知识图谱中所述文章实体与所述CVE实体之间的映射关系,以及所述CVE实体与所述CWE实体之间的映射关系,确定所述漏洞分析文章与所述CWE社区的对应关系。
6.根据权利要求4所述的CWE社区描述方法,其特征在于,
所述根据每个所述CWE社区对应的所述漏洞分析文章的分类和主题,分别对每个所述CWE社区进行标准化描述,包括:
根据所述漏洞分析文章的分类情况,统计某个CWE社区对应的综述文章的数量和详细描述文章的数量,进而计算数量较多的那一类文章的占比;
根据抽取结果,确定该CWE社区对应的每个漏洞分析文章的主题;
将该CWE社区对应的各漏洞分析文章的主题词分布相加并求平均值,得到该CWE社区的主题词平均分布;
将所述主题词平均分布中的所有主题词按出现频率的高低进行排序;
按照所述占比截取排在前面的主题词,用于对该CWE社区进行标准化描述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四维创智(北京)科技发展有限公司,未经四维创智(北京)科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211645595.7/1.html,转载请声明来源钻瓜专利网。