[发明专利]一种网络安全大数据分析方法、系统及相关装置有效
申请号: | 201811408283.8 | 申请日: | 2018-11-23 |
公开(公告)号: | CN109587125B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 陈霖;明哲;许爱东;陈华军;杨航;黄文琦;邓子杰 | 申请(专利权)人: | 南方电网科学研究院有限责任公司;中国南方电网有限责任公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L12/24;G06N20/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 510663 广东省广州市萝岗区科*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络安全 数据 分析 方法 系统 相关 装置 | ||
本申请所提供的一种网络安全大数据分析方法,包括:将内部数据源和外部数据源进行异构信息集成,得到集成数据;利用流式处理算法对集成数据进行实时流式处理,得到流式数据集;利用内部数据源的历史数据及外部数据源的历史数据进行模型训练,得到深度学习模型;将流式数据集输入深度学习模型,得到风险评估结果;对风险评估结果中的各个风险数据进行溯源分析处理,分别建立各个风险数据与内部数据源或外部数据源之间的关联。该方法是利用多源异构数据的历史数据经过模型训练得到的深度学习模型进行风险评估,能够提高发现的风险数据及风险源的准确性。本申请还提供一种网络安全大数据分析系统、设备及计算机可读存储介质,均具有上述有益效果。
技术领域
本申请涉及网络安全领域,特别涉及一种网络安全大数据分析方法、系统、设备及计算机可读存储介质。
背景技术
目前日志、网络流量等数据用于安全分析的技术已经很成熟,但是,由于保留和分析大量数据所消耗的成本较高,系统日志与主机活动等数据一般保留一段时间后被删除。为实现对网络或云计算平台等系统的全面安全分析,需要从全局的角度获取安全分析所需数据,包括:网络数据包、日志、资产状态、业务信息、漏洞信息、身份认证与访问信息、用户行为信息、配置信息等,可能还需要来自互联网的外部情报信息等数据。这些数据产生的速度越来越快,且数据类型涵盖结构化、半结构化和非结构化,呈现出大数据的特点。相关技术中,利用传统机器学习方法对多源异构数据进行分析,由于传统机器学习方法针对所有的数据都是统一的分析模式,对于不同的数据不具有针对性,导致发现的风险数据及风险源准确性不高。
因此,如何有针对性地对多源异构数据进行实时性深入分析,进而提高发现的风险数据及风险源的准确性是本领域技术人员需要解决的技术问题。
发明内容
本申请的目的是提供一种网络安全大数据分析方法、系统、设备及计算机可读存储介质,能够有针对性地对多源异构数据进行实时性深入分析,进而提高发现的风险数据及风险源的准确性。
为解决上述技术问题,本申请提供一种网络安全大数据分析方法,包括:
将内部数据源和外部数据源进行异构信息集成,得到集成数据;
利用流式处理算法对所述集成数据进行实时流式处理,得到流式数据集;
利用所述内部数据源的历史数据及所述外部数据源的历史数据进行模型训练,得到深度学习模型;
将所述流式数据集输入所述深度学习模型,得到风险评估结果;
对所述风险评估结果中的各个风险数据进行溯源分析处理,分别建立各个所述风险数据与所述内部数据源或所述外部数据源之间的关联。
优选地,所述将内部数据源和外部数据源进行异构信息集成,得到集成数据,包括:
对所述内部数据源和所述外部数据源进行数据抽取处理,得到目标数据;
利用XML技术对所述目标数据进行数据格式转换,得到所述集成数据。
优选地,所述利用流式处理算法对所述集成数据进行实时流式处理,得到流式数据集,包括:
利用Spark Streaming算法和Spark Engine算法对所述集成数据进行实时流式处理,得到所述流式数据集。
优选地,所述分别建立各个所述风险数据与所述内部数据源或所述外部数据源之间的关联之后,还包括:
利用可视化工具以图形化的形式输出各个所述风险数据与对应的内部数据源或外部数据源的所述关联。
本申请还提供一种网络安全大数据分析系统,包括:
异构信息集成模块,用于将内部数据源和外部数据源进行异构信息集成,得到集成数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方电网科学研究院有限责任公司;中国南方电网有限责任公司,未经南方电网科学研究院有限责任公司;中国南方电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811408283.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电力网络的处理方法、装置和系统
- 下一篇:数据采集方法、网络设备及控制器
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置