[发明专利]网络安全知识图谱的生成方法、装置、设备及存储介质在审
申请号: | 201811062222.0 | 申请日: | 2018-09-12 |
公开(公告)号: | CN109347798A | 公开(公告)日: | 2019-02-15 |
发明(设计)人: | 申勇 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06F16/36 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘佳;王宝筠 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图谱 网络安全 三元组 初始信息 存储介质 信息安全 构建 描述信息 收集数据 属性关系 相关信息 信息参考 信息对象 知识结构 漏洞 查找 网络 | ||
本发明公开了一种网络安全知识图谱的生成方法、装置、设备及存储介质,包括:在网络安全相关的收集数据中提取网络安全知识图谱的初始信息,从提取的初始信息中提取知识图谱三元组,其中,一个知识图谱三元组包括两个知识图谱实体以及两个知识图谱实体之间的属性关系,该两个知识图谱实体均为网络安全相关的信息对象,然后,以提取出的知识图谱三元组构建网络安全知识图谱的网络,从而可以将广泛的网络安全相关信息变成简洁的关系化知识结构信息。这样,技术人员可以利用构建出的网络安全知识图谱查找出该信息安全漏洞或者弱点的应对策略和/或描述信息,为技术人员处理该信息安全漏洞或者弱点提供信息参考。
技术领域
本发明涉及数据处理技术领域,特别是涉及一种网络安全知识图谱的生成方法、装置、设备及存储介质。
背景技术
随着网络的广泛应用,各领域的网络数据正在处于飞速增长中。如何更方便地在海量的网络数据中获取有价值的数据和信息,已成为各领域人员都需要面对的问题。例如,在网络安全领域中,技术人员往往需要利用网络安全相关的网络数据来查找针对特定的漏洞或弱点的应对策略。尤其是,在网络安全相关的信息对象之间的关系中,往往也存在技术人员需要了解的信息。
发明内容
本申请实施例提供了一种网络安全知识图谱的生成方法、装置、设备以及存储介质,以使得技术人员能够利用网络安全知识图谱更便捷地搜索、挖掘、分析网络安全相关的信息,从而使得技术人员能够更便捷地共享网络安全问题的应对策略。
第一方面,本申请实施例提供了一种网络安全知识图谱的生成方法,该方法包括:
在网络安全相关的收集数据中提取所述网络安全知识图谱的初始信息;
从所述初始信息中提取知识图谱三元组,其中,所述知识图谱三元组包括两个知识图谱实体以及所述两个知识图谱实体之间的属性关系,所述两个知识图谱实体均为网络安全相关的信息对象;
以所述知识图谱三元组构建所述网络安全知识图谱的网络。
在一些可能的实施方式中,所述在网络安全相关的收集数据中提取所述网络安全知识图谱的初始信息,包括:
收集网络安全相关的数据信息,作为所述收集数据;
对所述收集数据进行归一化处理,得到所述初始信息,以使得所述收集数据中相同含义的不同描述信息被统一成所述初始信息中相同的描述信息。
在一些可能的实施方式中,所述从所述初始信息中提取知识图谱三元组,包括:
在所述初始信息中选取训练语料;
通过对所述训练语料进行词性和语法分析,对所述训练语料进行学习,以生成语法模板;
基于所述初始信息中与所述语法模板相匹配的信息,提取所述知识图谱三元组。
在一些可能的实施方式中,所述从所述初始信息中提取知识图谱三元组,包括:
获取预先收集的三元组语义模板;
在所述初始信息中查找与所述三元组语义模板相匹配的信息,作为目标信息;
按照所述三元组语义模板对应的三元组提取规则,在所述目标信息中提取所述知识图谱三元组。
在一些可能的实施方式中,所述以所述知识图谱三元组构建所述网络安全知识图谱的网络,包括:
针对所述知识图谱三元组所涉及的知识图谱实体,对所述知识图谱实体进行聚类分析;
通过聚类分析的结果,将同一聚类中具有不同描述信息的知识图谱实体进行合并;
通过聚类分析的结果,将不同聚类中具有相同描述信息的知识图谱实体区分为不同的知识图谱实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811062222.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:业务访问控制方法及装置
- 下一篇:一种基于区块链技术的身份信息管理方法及系统