[发明专利]一种用于构建流量图像数据集的方法及系统有效

专利信息
申请号: 201910810810.6 申请日: 2019-08-29
公开(公告)号: CN110704649B 公开(公告)日: 2022-09-02
发明(设计)人: 王攀;李书航;王梓炫;黄琛 申请(专利权)人: 南京邮电大学
主分类号: G06F16/51 分类号: G06F16/51
代理公司: 南京瑞弘专利商标事务所(普通合伙) 32249 代理人: 彭雄
地址: 210000 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种用于构建流量图像数据集的方法及系统,包括:读取Pcap源文件,解析并过滤PCAP文件的前24个字节,代表文件头相关信息;按照Pcap包的分组信息解析各组流量信息;解析出来的信息需要经过字符串分割、正则匹配、进制转换后,将所有字节信息按照对应分组编号保存至对应txt文件;读取生成的txt文件,生成成灰度图。将Pcap包转为图像后便可将其制作成类似MNIST手写体的数据集。本发明通过对Pcap文件和数据包格式的解析,实现将Pcap文件转换为灰度图,该图可用建立深度学习模型训练的数据集,提高了流量识别在深度学习领域的适用性。
搜索关键词: 一种 用于 构建 流量 图像 数据 方法 系统
【主权项】:
1.一种用于构建流量图像数据集的方法,其特征在于,包括以下步骤:/n步骤一、获取Pcap文件,读取Pcap文件,解析出Pcap文件数据包的前24个文件头结构,并建立标记位(flag)进行数据包分组,同时将文件头过滤;/n步骤二、根据数据包的格式,各分组前24个字节为包头,包含文件信息,解析出其中的”Len”字段,即数据包长度,根据步骤一中的标记位,截取出该分组的全部数据包,统计完整数据包分组的计算公式为:flag+24+Len;按照数据包分组对Pcap文件进行解析;/n步骤三、对步骤二中得到的分组信息,首先根据十六进制标识符将数据分割,得到一个List,遍历List中的每个元素,根据正则匹配将不符合规则的Ascii码转为十六进制数据,最后将所有数据根据分组编号存入对应的txt文件中,该文件中全部为十六进制数据;/n步骤四、步骤三完成后将一个Pcap文件按照分组解析成多个txt文件,根据数据包规则,一个字节中包含两个十六进制字符,顺序读取txt文件中的两个字符并转为十进制,转换后的数字范围在0到255之间,0对应黑色,255对应白色,转换后字节被存入数组中,数组中的一个元素对应图片中的一个像素点,按照这个规则将分组信息转换成灰度图;/n步骤五、根据步骤四中生成的灰度图建立数据集。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910810810.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top