[发明专利]基于深度学习的I2P流量识别方法及系统在审
申请号: | 202110075899.3 | 申请日: | 2021-01-20 |
公开(公告)号: | CN112887291A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 景全亮;范鑫鑫;毕经平;武超;雷蕾;张永 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L12/24;G06N3/08 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 i2p 流量 识别 方法 系统 | ||
本发明提出一种基于深度学习的I2P流量识别方法及系统。包括将各流量信息转换为相应的灰度图像,为之后利用深度学习卷积神经网络进行流量识别提供模型输入,以实现快速识别I2P流量的目标。在保证算法准确率的条件下,优化现有I2P流量识别算法的数据预处理流程,减少了现有方法在特征工程阶段的工作量。
技术领域
本发明涉及网络通信中报文识别领域,并特别涉及一种基于深度学习的I2P流量识别方法及系统。
背景技术
近年来,随着互联网技术飞速发展,海量信息数据通过互联网进行传输。匿名通信技术作为保护用户隐私与个人信息数据安全的工具,得到了广泛关注。匿名通信技术通常利用内容加密、多跳转发、流量混淆等手段实现通信数据和通信关系的匿名化,保护通信双方的通信关系与通信内容。
I2P作为当前主流的匿名通信工具,依靠大蒜路由技术实现通信的匿名性。使用大蒜路由技术的通信双方均使用多跳单向加密隧道进行通信,通信隧道中的每一跳节点只掌握相邻节点的信息,无法获知通信双方的通信关系。目前,I2P报文识别算法多为基于I2P流量包特征、流特征匹配的识别算法。例如《基于I2P的匿名通信协议分析与流量检测的研究》采用基于载荷长度熵过滤及载荷长度序列过滤的方法来过滤未知流量并识别I2P流量。该方法的核心思路是提取I2P会话中流长度熵特征及载荷序列特征,利用贝叶斯网络统计学习算法来识别I2P报文。其中,载荷序列特征为I2P会话密钥交互过程中的流量上下行关系,以↑表示上行网络数据长度,↓表示下行网络数据长度,I2P会话建立过程中会出现“↑288↓304↑448↓48”、“↑288↓304↑464↓48”等固定载荷序列。流长度熵特征的计算方法主要有两步:(1)统计当前会话中各数据包的报文长度,按报文长度,该长度出现次数进行聚合,之后计算某报文长度出现次数占数据包总数的比率p(Ai),例如,A会话中共含20个数据包,长度为334的数据包出现次数为3,则p(A334)=15%,形成当前会话的数据包长度分布;(2)计算会话A与各已识别会话的数据包长度分布的相对熵,公式如下:
若相对熵超过阈值,则标记该会话为I2P会话。
深度学习作为人工智能的核心技术,近年来在计算机视觉、自然语言处理等领域取得巨大成功。基于深度学习的图像识别系统也得到了广泛应用,利用深度学习技术识别流量“图像”的想法也得到了广泛关注。例如采用LeNet深度学习网络识别Tor网络报文,通过改进LeNet神经网络结构,并根据Tor网络通信特点提出源ip地址、目的ip地址、源端口、目的端口、传输层协议的数据包五元组通信特征来完成Tor流量的识别。
现有方案多基于传统统计机器学习方法,该类方法往往伴随着繁琐、复杂的数据预处理及人工筛选特征过程,在解决实际流量识别问题时,尤其是构建问题特征阶段,需要研究人员对该问题具有较为充分的认识。而基于深度学习的流量识别算法在保证识别准确度的前提下,对原始流量的预处理较少,没有繁琐的特征提取过程,极大的减少了特征工程阶段的工作量。
发明内容
本发明的目的是简化I2P流量识别过程中繁琐的数据预处理过程与人工筛选特征的过程,提出了一种基于深度学习的I2P流量识别方法,其中包括:
步骤1、获取已标记I2P流量类别标签的流量文件作为训练数据,提取该训练数据中数据包的报文字段,得到五元组信息,该五元组信息由该数据包的源IP地址、目的IP地址、源数据端口、目的数据端口及载荷长度组成;
步骤2、判断该数据包中运输层的协议类型是否为TCP协议,若是,则按TCP流对数据包的载荷长度进行聚合,否则按由源IP地址、源数据端口、目的IP地址和目的数据端口组成的四元组对数据包的载荷长度进行聚合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110075899.3/2.html,转载请声明来源钻瓜专利网。