[发明专利]基于网络行为特征的暗网加密应用服务识别方法及系统有效

专利信息
申请号: 202111253442.3 申请日: 2021-10-27
公开(公告)号: CN114124463B 公开(公告)日: 2023-05-16
发明(设计)人: 李航;丁建伟;吕振远;陈周国;王鑫 申请(专利权)人: 中国电子科技集团公司第三十研究所
主分类号: H04L9/40 分类号: H04L9/40;H04L41/16;H04L61/4511;H04L67/02
代理公司: 成都九鼎天元知识产权代理有限公司 51214 代理人: 罗强
地址: 610000 *** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 网络 行为 特征 加密 应用服务 识别 方法 系统
【权利要求书】:

1.基于网络行为特征的暗网加密应用服务识别方法,其特征在于,包括:

步骤1、采集历史一段时间内明网与暗网的应用流量数据,并根据五元组信息标注出对应的应用服务,作为训练集;

步骤2、以应用流量数据的五元组作为关键值对会话进行解析,提取会话特征;

步骤3、基于提取的会话特征,提取源IP地址对应的行为特征,同时提取目的IP地址与端口对应的行为特征,组合构建为IP行为特征;

步骤4、按相同的源IP地址,将IP行为特征拼接到会话特征中,形成网络行为特征集;

步骤5、根据网络行为特征集与训练集进行预测模型进行训练,完成训练后,通过预测模型对未知的网络行为特征样本进行应用服务识别;

会话特征包括统计特征、有效载荷特征、指纹特征、时间特征以及背景流量特征;所述统计特征包括数据报延迟时间特征、数据流的包长度统计特征、发送数据流的载荷长度统计特征、接收数据流的载荷长度统计特征以及有效载荷的字节分布统计特征;所述背景流量特征包括DNS响应信息中DNS响应中域名长度、DNS响应信息中域名中数字与非数字字符长度比、DNS响应信息中TTL值、DNS响应返回的IP地址数、DNS响应信息中域名在Alexa网站中的排名情况;所述指纹特征包括TCP指纹特征、TLS指纹特征;所述有效载荷特征包括首部标志特征、TLS与HTTP会话中的host特征;

行为特征包括:统计特征、历史行为特征以及背景信息特征;

其中,统计特征包括源IP发起会话的到达时间间隔特征、源IP发起请求的时间分布特征、源IP发起请求的频率特征、源IP所在会话与源IP的比例特征;历史行为特征包括源IP地址一段时间内HTTP会话、HTTPS会话、UDP会话、TCP会话的请求数以及源IP地址使用加密流量的时间频率;背景信息特征包括加密流量中的源/目的IP检测其是否标记为恶意IP、IP所属地址是否在境外、IP是否属于IDC。

2.根据权利要求1所述的基于网络行为特征的暗网加密应用服务识别方法,其特征在于,在进行预测模型训练之前,判断是否已存在暗网加密应用类型预测模型,若已存在,则直接通过该模型进行暗网加密应用服务识别,若不存在,进行预测模型训练,通过训练好的模型进行暗网加密应用服务识别。

3.根据权利要求2所述的基于网络行为特征的暗网加密应用服务识别方法,其特征在于,采用支持向量机作为预测模型。

4.根据权利要求3所述的基于网络行为特征的暗网加密应用服务识别方法,其特征在于,预测模型的训练方法为:将网络行为特征集与训练集输入支持向量机,选择随机森林算法,设置算法参数,进行预测模型训练。

5.一种基于网络行为特征的暗网加密应用服务识别系统,其特征在于,包括流量数据采集与处理模块、会话特征提取模块、IP行为特征提取模块、机器学习算法训练与预测模块;

流量数据采集与处理模块,用于采集明网与暗网应用流量数据,并进行预处理,形成训练集;

会话特征提取模块,用于提取会话特征;

IP行为特征提取模块,用于基于会话特征提取IP行为特征;

机器学习算法训练与预测模块,用于将会话特征与IP行为特征拼接形成网络行为特征,并根据网络行为特征与训练集进行预测模型进行训练,完成训练后,通过预测模型对未知的网络行为特征样本进行应用服务识别,输出预测结果;

会话特征包括统计特征、有效载荷特征、指纹特征、时间特征以及背景流量特征;所述统计特征包括数据报延迟时间特征、数据流的包长度统计特征、发送数据流的载荷长度统计特征、接收数据流的载荷长度统计特征以及有效载荷的字节分布统计特征;所述背景流量特征包括DNS响应信息中DNS响应中域名长度、DNS响应信息中域名中数字与非数字字符长度比、DNS响应信息中TTL值、DNS响应返回的IP地址数、DNS响应信息中域名在Alexa网站中的排名情况;所述指纹特征包括TCP指纹特征、TLS指纹特征;所述有效载荷特征包括首部标志特征、TLS与HTTP会话中的host特征;

行为特征包括:统计特征、历史行为特征以及背景信息特征;

其中,统计特征包括源IP发起会话的到达时间间隔特征、源IP发起请求的时间分布特征、源IP发起请求的频率特征、源IP所在会话与源IP的比例特征;历史行为特征包括源IP地址一段时间内HTTP会话、HTTPS会话、UDP会话、TCP会话的请求数以及源IP地址使用加密流量的时间频率;背景信息特征包括加密流量中的源/目的IP检测其是否标记为恶意IP、IP所属地址是否在境外、IP是否属于IDC。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第三十研究所,未经中国电子科技集团公司第三十研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111253442.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top