[发明专利]一种网络安全情报数据的分类方法、系统及相关装置在审
申请号: | 201811457574.6 | 申请日: | 2018-11-30 |
公开(公告)号: | CN109543089A | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 陈霖;明哲;许爱东;陈华军;杨航;黄文琦;邓子杰 | 申请(专利权)人: | 南方电网科学研究院有限责任公司;中国南方电网有限责任公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/35 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 510663 广东省广州市萝岗区科*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络安全 情报数据 关键信息 目标关键词 网络爬虫 关键词提取 图模型 分类 计算机可读存储介质 方法提取 分类模型 分类系统 输入文本 相关装置 爬虫 网站 预设 申请 取出 | ||
1.一种网络安全情报数据的分类方法,其特征在于,包括:
利用网络爬虫从预设数量的网络安全网站中爬取出网络安全情报数据;其中,所述网络爬虫为具有抗反爬虫能力的网络爬虫;
利用人工规则关键句提取方法从所述网络安全情报数据中提取出目标关键句;
利用图模型关键词提取方法从所述网络安全情报数据中提取出目标关键词;
将目标关键信息输入文本分类模型,确定所述目标关键信息的类别;其中,所述目标关键信息包括所述目标关键句和所述目标关键词。
2.根据权利要求1所述的网络安全情报数据的分类方法,其特征在于,所述利用图模型关键词提取方法从所述网络安全情报数据中提取出目标关键词,包括:
将所述网络安全情报数据按照完整句子进行分割,得到各个句子;
从各个所述句子中筛选出预设词性的词语;
在利用各个所述词语构建关键词图后,利用共现关系确定所述关键词图中每个节点与其他节点的关联程度;其中,每个所述节点对应一个所述词语;
在根据所述关联程度计算各个所述节点的权重后,对各个所述权重进行倒序排序,得到权重顺序表;
将所述权重顺序表中前面预设数量的权重对应的词语确定为所述目标关键词。
3.根据权利要求1所述的网络安全情报数据的分类方法,其特征在于,确定所述目标关键信息的类别之后,还包括:
根据所述目标关键信息的所述类别,将所述目标关键信息存储至分布式文件存储系统中。
4.根据权利要求1所述的网络安全情报数据的分类方法,其特征在于,所述将目标关键信息输入文本分类模型,确定所述目标关键信息的类别,包括:
利用历史数据进行模型训练,得到所述文本分类模型;
将所述目标关键信息输入所述文本分类模型,确定所述目标关键信息的所述类别。
5.一种网络安全情报数据的分类系统,其特征在于,包括:
爬取模块,用于利用网络爬虫从预设数量的网络安全网站中爬取出网络安全情报数据;其中,所述网络爬虫为具有抗反爬虫能力的网络爬虫;
目标关键句提取模块,用于利用人工规则关键句提取方法从所述网络安全情报数据中提取出目标关键句;
目标关键词提取模块,用于利用图模型关键词提取方法从所述网络安全情报数据中提取出目标关键词;
类别确定模块,用于将目标关键信息输入文本分类模型,确定所述目标关键信息的类别;其中,所述目标关键信息包括所述目标关键句和所述目标关键词。
6.根据权利要求5所述的网络安全情报数据的分类系统,其特征在于,所述目标关键词提取模块,包括:
分割单元,用于将所述网络安全情报数据按照完整句子进行分割,得到各个句子;
筛选单元,用于从各个所述句子中筛选出预设词性的词语;
关联程度确定单元,用于在利用各个所述词语构建关键词图后,利用共现关系确定所述关键词图中每个节点与其他节点的关联程度;其中,每个所述节点对应一个所述词语;
权重排序单元,用于在根据所述关联程度计算各个所述节点的权重后,对各个所述权重进行倒序排序,得到权重顺序表;
目标关键词确定单元,用于将所述权重顺序表中前面预设数量的权重对应的词语确定为所述目标关键词。
7.根据权利要求5所述的网络安全情报数据的分类系统,其特征在于,还包括:
存储模块,用于根据所述目标关键信息的所述类别,将所述目标关键信息存储至分布式文件存储系统中。
8.根据权利要求5所述的网络安全情报数据的分类系统,其特征在于,所述类别确定模块,包括:
模型训练单元,用于利用历史数据进行模型训练,得到所述文本分类模型;
类别确定单元,用于将所述目标关键信息输入所述文本分类模型,确定所述目标关键信息的所述类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方电网科学研究院有限责任公司;中国南方电网有限责任公司,未经南方电网科学研究院有限责任公司;中国南方电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811457574.6/1.html,转载请声明来源钻瓜专利网。