[发明专利]一种用于构建流量图像数据集的方法及系统有效
申请号: | 201910810810.6 | 申请日: | 2019-08-29 |
公开(公告)号: | CN110704649B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 王攀;李书航;王梓炫;黄琛 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/51 | 分类号: | G06F16/51 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 彭雄 |
地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于构建流量图像数据集的方法及系统,包括:读取Pcap源文件,解析并过滤PCAP文件的前24个字节,代表文件头相关信息;按照Pcap包的分组信息解析各组流量信息;解析出来的信息需要经过字符串分割、正则匹配、进制转换后,将所有字节信息按照对应分组编号保存至对应txt文件;读取生成的txt文件,生成成灰度图。将Pcap包转为图像后便可将其制作成类似MNIST手写体的数据集。本发明通过对Pcap文件和数据包格式的解析,实现将Pcap文件转换为灰度图,该图可用建立深度学习模型训练的数据集,提高了流量识别在深度学习领域的适用性。 | ||
搜索关键词: | 一种 用于 构建 流量 图像 数据 方法 系统 | ||
【主权项】:
1.一种用于构建流量图像数据集的方法,其特征在于,包括以下步骤:/n步骤一、获取Pcap文件,读取Pcap文件,解析出Pcap文件数据包的前24个文件头结构,并建立标记位(flag)进行数据包分组,同时将文件头过滤;/n步骤二、根据数据包的格式,各分组前24个字节为包头,包含文件信息,解析出其中的”Len”字段,即数据包长度,根据步骤一中的标记位,截取出该分组的全部数据包,统计完整数据包分组的计算公式为:flag+24+Len;按照数据包分组对Pcap文件进行解析;/n步骤三、对步骤二中得到的分组信息,首先根据十六进制标识符将数据分割,得到一个List,遍历List中的每个元素,根据正则匹配将不符合规则的Ascii码转为十六进制数据,最后将所有数据根据分组编号存入对应的txt文件中,该文件中全部为十六进制数据;/n步骤四、步骤三完成后将一个Pcap文件按照分组解析成多个txt文件,根据数据包规则,一个字节中包含两个十六进制字符,顺序读取txt文件中的两个字符并转为十进制,转换后的数字范围在0到255之间,0对应黑色,255对应白色,转换后字节被存入数组中,数组中的一个元素对应图片中的一个像素点,按照这个规则将分组信息转换成灰度图;/n步骤五、根据步骤四中生成的灰度图建立数据集。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910810810.6/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序