[发明专利]一种基于FPGA的在线流量业务分类方法在审
申请号: | 202110825550.7 | 申请日: | 2021-07-21 |
公开(公告)号: | CN113572703A | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 胡晓艳;刘旭辉;程光 | 申请(专利权)人: | 东南大学 |
主分类号: | H04L12/851 | 分类号: | H04L12/851;G06K9/62 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 郭微 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 fpga 在线 流量 业务 分类 方法 | ||
1.一种基于FPGA的在线流量业务分类方法,其特征在于,包括如下步骤:
(1)利用包含不同业务类型流量的数据集,以每条流的前几个报文的统计数据作为流量业务类型分类特征来训练随机森林流量业务分类模型,并使用直接描述的方法将该模型部署于FPGA上;
(2)流类别信息RAM存储五元组流的业务类别信息,流统计数据RAM存储五元组流的特征数据,对于进入的报文,根据报文五元组读取流类别信息RAM中所存储的信息确定其所属流是否已分类,若已分类则采用分类类别进行标记,若尚未分类则采用默认分类类别进行标记并在流类别信息RAM和流统计数据RAM中存储或更新相应数据;
(3)对于一条五元组流,在流统计数据RAM中存储了足够的特征数据之后,控制读出该流的所有特征数据,然后送入步骤(1)中部署的随机森林流量业务分类模型;
(4)在随机森林分类业务分类模型部分,首先对于步骤(3)中传入的特征数据进行简单计算处理,然后通过随机森林模型得到该流的业务类别信息,并将业务类别信息写入到流类别信息RAM中。
2.根据权利要求1所述的基于FPGA的在线流量业务分类方法,其特征在于,所述步骤(1)具体包括如下子步骤:
(1.1)根据3GPP组织的建议将公开数据集中的各种应用的流量分为会话类、流媒体类、交互类以及背景类四种流量业务类型;
(1.2)经过实验对比,提取每条五元组流的前4个报文的报文长度、到达时间间隔特征来训练随机森林流量业务分类模型;
(1.3)对于训练好的随机森林流量业务分类模型采取直接描述的方法部署在FPGA上,随机森林是由一系列决策树组成的,每颗决策树的非叶子节点有需要比较的特征和相应的阈值、叶子节点有相应的分类信息,使用Verilog语言直接描述各个节点是否为叶子节点、各个非叶子节点需要比较的特征数据以及阈值;
(1.4)设计两个时钟完成流量业务分类过程,第一个时钟周期遍历所有的决策树,得到每颗决策树的分类结果,第二个时钟周期进行多数投票决策,得到最终的分类结果,多数投票过程通过组合电路实现;
(1.5)经过综合后生成的硬件逻辑电路即可实现随机森林流量业务分类模型的业务分类功能。
3.根据权利要求1所述的基于FPGA的在线流量业务分类方法,其特征在于,所述步骤(2)具体包括如下子步骤:
(2.1)对于进入的报文首先提取该报文的五元组、报文长度以及到达时间;
(2.2)利用并行模式的CRC哈希算法,对(2.1)中提取的五元组进行哈希计算,确定该报文所属流在流类别信息RAM中所存储的地址;
(2.3)读取流类别信息RAM中的数据,包括已分类标志、类别信息、该流已到达报文计数,若已分类标志标记为已分类,则将该报文标记为相应的类别信息,然后转入步骤(2.7),否则,将该报文标记为默认类别信息,然后转入步骤(2.4);
(2.4)若报文计数小于4,则进行特征数据存储,然后转入步骤(2.5),否则,进行特征数据读取,然后转入步骤(2.6);
(2.5)将该报文所属流在流信息RAM中存储的报文计数加一,同时计算流统计数据RAM写地址,将(2.1)提取的报文长度和时间戳信息写入到流统计数据RAM,然后转入步骤(2.7);
(2.6)触发分类信号,计算流统计数据RAM读地址,然后转入步骤(2.7);
(2.7)标记过的报文送出在线流量业务分类模块。
4.根据权利要求1所述的基于FPGA的在线流量业务分类方法,其特征在于,所述步骤(3)具体包括如下子步骤:
(3.1)对于同一条流需要存储四条特征数据,流统计数据RAM采取连续内存块的形式存储同一条流的数据,每一行存储的数据包括报文长度、时间戳;
(3.2)检测到触发的分类信号时,将流统计数据RAM的读地址送入FIFO进行缓存;
(3.3)若FIFO非空,读取FIFO中的流统计数据RAM的读地址;
(3.3)根据流统计数据RAM读地址对该报文所属流的所有特征数据进行读取,通过有限状态机将以该地址为首地址的四条连续数据在四个时钟周期内依次读出;
(3.4)将读取的四条数据送入(1.5)得到的分类模型中进行业务分类,同时传入流统计数据RAM读地址。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110825550.7/1.html,转载请声明来源钻瓜专利网。