[发明专利]基于海量实时互联网DPI数据的流式处理方法及系统有效

申请号：	201611258319.X	申请日：	2016-12-30
公开（公告）号：	CN107294801B	公开（公告）日：	2020-03-31
发明（设计）人：	黄凯翔;周蓉;张国华;许睿	申请（专利权）人：	江苏号百信息服务有限公司
主分类号：	H04L12/26	分类号：	H04L12/26;H04L29/08
代理公司：	南京钟山专利代理有限公司 32252	代理人：	戴朝荣
地址：	210006 江苏省***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种基于海量实时互联网DPI数据的流式处理方法，并包括如下步骤：接口协议层接收海量实时互联网DPI数据，并对所述DPI数据进行采集清洗过滤；Kafka集群接收来自所述接口协议层的DPI数据，并存放在对应Topics的具体分区中；Storm集群间隔设定的时间去所述Kafka集群的Topics中去获取所述DPI数据，且对应的处理单元Topology对这些数据进行相应的预处理，并将预处理后的结果数据输出到所述Kafka集群对应的Topics中；Spark Streaming集群间隔设定的时间去所述Kafka集群的Topics中获取经所述Strom集群预处理后的DPI数据，对所述预处理后的DPI数据进行复制和分发，并将最终的处理结果以<key，value>的形式存入KV数据库集群的数据库中。本发明还提供一种基于海量实时互联网DPI数据的流式处理方法的系统。
搜索关键词：	基于海量实时互联网 dpi 数据处理方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于海量实时互联网DPI数据的流式处理方法，其特征在于：包括如下步骤：一、接口协议层接收海量实时互联网DPI数据，并对所述DPI数据进行采集清洗过滤；二、Kafka集群接收来自所述接口协议层的DPI数据，并存放在对应Topics的具体分区中；三、Storm集群间隔设定的时间去所述Kafka集群的Topics中去获取所述DPI数据，且对应的处理单元Topology对这些数据进行相应的预处理，并将预处理后的结果数据输出到所述Kafka集群对应的Topics中；四、Spark Streaming集群间隔设定时间去所述Kafka集群的Topics中获取经所述Strom集群预处理后的DPI数据，对所述预处理后的DPI数据进行复制和分发，并将最终的处理结果以<key，value>的形式存入KV数据库集群的数据库中。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于江苏号百信息服务有限公司，未经江苏号百信息服务有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201611258319.X/，转载请声明来源钻瓜专利网。

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L12-00 数据交换网络
H04L12-02 .零部件
H04L12-28 .以通路配置为特征的，例如LAN[局域网]或WAN[广域网]
H04L12-50 .电路交换系统，即系统在通信期间通路具有完全永久性
H04L12-54 .存储转发交换系统
H04L12-64 .混合交换系统

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于海量实时互联网DPI数据的流式处理方法及系统有效

专利文献下载