[发明专利]一种应用于云审计系统的数据采集装置在审
申请号: | 201710782910.3 | 申请日: | 2017-09-03 |
公开(公告)号: | CN107645542A | 公开(公告)日: | 2018-01-30 |
发明(设计)人: | 谢尧;洪丹轲;杨俊权;徐键;张思拓;吴柳 | 申请(专利权)人: | 中国南方电网有限责任公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;H04L12/24;H04L12/26;G06F17/30 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙)11350 | 代理人: | 汤东凤 |
地址: | 510000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 审计 系统 数据 采集 装置 | ||
1.一种应用于云审计系统的数据采集装置,向上外接云审计系统的审计数据中心子系统,向下外接数据源;包括:用于采集日志数据的日志审计子系统和用于采集网络流量数据的网络审计子系统;其特征在于:
所述的日志审计子系统包括:用于收集日志数据的日志收集服务器和用于分析处理日志数据的日志分析处理引擎;其特征在于,所述的日志收集服务器还包括:日志采集模块,用于对外部日志源进行日志数据采集;日志缓存模块,用于将采集的日志数据进行后续处理的缓存;日志分发模块,用于根据日志分析处理引擎的审计指令将对应的日志数据分发到日志分析处理引擎;
所述的日志分析处理引擎还包括:日志标准化模块,用于将采集到的日志数据标准化处理;日志索引模块,用于将日志数据建立分布式索引;日志关联分析模块,用于根据预设的关联规则库的规则进行日志数据关联分析,并根据关联分析结果对日志数据进行分类入库;日志数据上报模块,用于将完成分类入库的原始日志数据发送到kafka系统;
所述的网络审计子系统包括:网络审计处理引擎,用于审计从云数据中采集到的网络中虚拟机流量和物理机流量;主机流量采集代理,用于采集虚拟机流量并分发至网络审计处理引擎;网络流量采集代理,用于采集物理机流量并分发至网络审计处理引擎;
所述的网络审计处理引擎还包括:网络数据处理模块,用于采用分布式实时在线分析系统对网络数据进行分布式处理,首先订阅特征向量主题,将数据从kafka中读取出来,并进行预处理,将数据序列化为avro形式,然后进行特征向量处理,最后写入kafka与HDFS;网络数据规则匹配模块,用于通过特征向量的DPI标识判断网络数据是否为非真实性网络协议、通过对特征向量与网络访问基线进行匹配判断网络数据是否为网络异常、通过对特征向量与服务器外联基线进行匹配判断网络数据是否为服务器违规外联、通过对特征向量与开放端口基线进行匹配判断网络数据是否为异常服务;当任一判断为异常时,发生报警信息;网络数据索引模块,用于对分布式存储的数据生成分布式索引;策略数据库,用于存储审计策略、抓包过滤策略、定向抓包策略;
所述的主机流量采集代理还包括:抓包模块,用于对外接虚拟机流量源的网络流量进行抓取并按照过滤策略进行过滤;协议识别模块,用于识别出网络流量的源ip、目的ip、源端口、目的端口、网络层协议、应用层协议;通用特征向量解析模块,用于按包提取网络层、传输层的信息、提取流信息;对于tcp协议的会话,解析并上报syn包的特征向量;对于udp协议的会话,解析并上报第一个包;对基于流的特征向量进行解析;分发模块,用于把数据包分发到缓存队列中;缓存队列的个数根据配置文件建立,和创建的深度特征向量解析线程匹配,每个深度特征向量解析线程分别对应一个缓存队列;同一个数据流上的数据包放在同一个缓存队列中,新建数据流上的数据包在各个缓存队列中轮流进行选择;深度特征向量解析模块,用于启动一个以上的深度特征向量解析线程,根据数据包的应用类型动态选择对应的深度特征向量解析插件进行解析;策略接收模块,用于从策略数据库读取抓包过滤策略、从策略数据库读取定向抓包策略;并在设定时间间隔更新抓包过滤策略及定向抓包策略;定向抓包模块,用于执行上位系统发送的定向抓包命令,将抓取的数据包通过数据上报模块反馈至所述上位系统;数据上报模块,用于将抓取的数据包通过数据通道反馈到上位系统;把通用特征向量通过数据通道上报给上位系统;把深度特征向量通过数据通道上报上位机;把定向包以pcap文件的形式通过数据通道上报给上位系统,或者以文件的形式存在本地;
所述的网络流量采集代理结构与主机流量采集代理相同,抓包的采集对象为外接的物理机流量源。
2.根据权利要求1所述的数据采集装置,其特征在于,所述的日志采集模块通过回调函数处理每一条日志,判断日志是否正确,解析日志结构,通过TcpSocket发送到日志关联分析模块。
3.根据权利要求1所述的数据采集装置,其特征在于,所述的日志标准化模块使用分布式实时在线分析系统(Storm)对日志进行分布式标准化处理;首先订阅日志主题,将数据从kafka系统中读取出来,并进行预处理,将数据序列化为avro形式,然后进行日志标准化,将日志数据对应相应插件类型进行标准化,最后写入kafka与HDFS。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国南方电网有限责任公司,未经中国南方电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710782910.3/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置