[发明专利]基于海量实时互联网DPI数据的流式处理方法及系统有效
申请号: | 201611258319.X | 申请日: | 2016-12-30 |
公开(公告)号: | CN107294801B | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 黄凯翔;周蓉;张国华;许睿 | 申请(专利权)人: | 江苏号百信息服务有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L29/08 |
代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 戴朝荣 |
地址: | 210006 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于海量实时互联网DPI数据的流式处理方法,并包括如下步骤:接口协议层接收海量实时互联网DPI数据,并对所述DPI数据进行采集清洗过滤;Kafka集群接收来自所述接口协议层的DPI数据,并存放在对应Topics的具体分区中;Storm集群间隔设定的时间去所述Kafka集群的Topics中去获取所述DPI数据,且对应的处理单元Topology对这些数据进行相应的预处理,并将预处理后的结果数据输出到所述Kafka集群对应的Topics中;Spark Streaming集群间隔设定的时间去所述Kafka集群的Topics中获取经所述Strom集群预处理后的DPI数据,对所述预处理后的DPI数据进行复制和分发,并将最终的处理结果以<key,value>的形式存入KV数据库集群的数据库中。本发明还提供一种基于海量实时互联网DPI数据的流式处理方法的系统。 | ||
搜索关键词: | 基于 海量 实时 互联网 dpi 数据 处理 方法 系统 | ||
【主权项】:
一种基于海量实时互联网DPI数据的流式处理方法,其特征在于:包括如下步骤:一、接口协议层接收海量实时互联网DPI数据,并对所述DPI数据进行采集清洗过滤;二、Kafka集群接收来自所述接口协议层的DPI数据,并存放在对应Topics的具体分区中;三、Storm集群间隔设定的时间去所述Kafka集群的Topics中去获取所述DPI数据,且对应的处理单元Topology对这些数据进行相应的预处理,并将预处理后的结果数据输出到所述Kafka集群对应的Topics中;四、Spark Streaming集群间隔设定时间去所述Kafka集群的Topics中获取经所述Strom集群预处理后的DPI数据,对所述预处理后的DPI数据进行复制和分发,并将最终的处理结果以<key,value>的形式存入KV数据库集群的数据库中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏号百信息服务有限公司,未经江苏号百信息服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611258319.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种便于安装的多功能开关
- 下一篇:一种压胶装置