[发明专利]以大数据流式技术实现网络数据包的分析方法及系统有效

申请号：	201510703275.6	申请日：	2015-10-26
公开（公告）号：	CN105376110B	公开（公告）日：	2018-10-30
发明（设计）人：	陈红;朱梦源;谢朝阳	申请（专利权）人：	上海华讯网络系统有限公司
主分类号：	H04L12/26	分类号：	H04L12/26;H04L29/06
代理公司：	上海汉声知识产权代理有限公司 31236	代理人：	郭国中
地址：	200127 上海市浦东新区***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种以大数据流式技术实现网络数据包的分析方法及系统，包括重传指标分析步骤和/或延时指标分析步骤。本发明还提供相应的以大数据流式技术实现网络数据包的网络指标计算装置。本发明由于与大数据Spark的结合，系统的扩展性、可维护性得到很大增强。随时间的推移，网络结构越来越复杂，网络流量越来越大，需要扩展系统容量时，Spark的扩展性得到很好体现，有效利用了Spark集群的优点。
搜索关键词：	数据流技术实现网络数据包分析方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种以大数据流式技术实现网络数据包的分析方法，其特征在于，包括重传指标分析步骤和/或延时指标分析步骤；所述重传指标分析步骤，包括如下步骤：步骤A：得到各个TCP报文的特征字符串，具体为：将TCP报文头信息中的报文序号seq、确认号ack、源IP、目的IP以字符串形式组成特征字符串，其中，源IP表示TCP/IP协议中发送方IP，目的IP表示TCP/IP协议中接收方IP；步骤B：统计相同的特征字符串的数量，将所述相同的特征字符串的数量作为TCP重传报文数量；所述延时指标分析步骤，包括如下步骤：步骤1：将数据流按时间T为时间间隔进行分片；步骤2：通过Spark Streaming实时计算框架的滑动窗口操作将分片得到的连续数据作为一次计算处理的数据转换成时间T的DStream数据集；步骤3：将时间T的DStream数据集进行map转换得到报文集合map，然后将报文集合map进行一次groupByKey操作，产生key值唯一的报文集合map；其中，key表示报文集合map中的键；步骤4：将从key值唯一的报文集合map中提取出的报文数量大于2的报文集合map，组成一个新报文集合map；步骤5：对所述新报文集合map进行遍历，计算出所述新报文集合map中的值之间的时间间隔，即：Ta＝T2‑T1，Tb＝T3‑T2，Tc＝T3‑T1；其中，Ta表示应用延时时间值，Tb表示客户端延时时间值，Tc表示网络延时时间值，T1表示第一次握手报文时间戳，T2表示第二次握手报文时间戳，T3表示第三次握手报文时间戳；步骤6：将时间T内的所有Ta、Tb、Tc分别计算出平均值和最大值作为网络延时指标；在报文集合map中：客户端发送的SYN＝1、ACK＝0的握手报文的key的计算公式为：key＝源IP+源端口+目的IP+目的端口+报文序号seq；服务端回复的SYN＝1，ACK＝1的确认报文的key的计算公式为：key＝目的IP+目的端口+源IP+源端口+(报文确认号ack‑1)；其他报文的key的计算公式为：key＝源IP+源端口+目的IP+目的端口+(报文序号seq‑1)。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海华讯网络系统有限公司，未经上海华讯网络系统有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510703275.6/，转载请声明来源钻瓜专利网。

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L12-00 数据交换网络
H04L12-02 .零部件
H04L12-28 .以通路配置为特征的，例如LAN[局域网]或WAN[广域网]
H04L12-50 .电路交换系统，即系统在通信期间通路具有完全永久性
H04L12-54 .存储转发交换系统
H04L12-64 .混合交换系统

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]以大数据流式技术实现网络数据包的分析方法及系统有效

专利文献下载