[发明专利]基于包长概率分布与k近邻算法的物联网设备识别方法有效
申请号: | 202011506245.3 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112633353B | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 杨家海;段晨鑫;王之梁 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G16Y30/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 罗文群 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 概率 分布 近邻 算法 联网 设备 识别 方法 | ||
1.一种基于包长概率分布与k近邻算法的物联网设备识别方法,其特征在于该方法包括以下步骤:
(1)实时采集一个待识别物联网设备的流量,得到一个网络数据包集合,网络数据包集合中的元素为与网络数据包的长度和方向相对应的二元组;
(2)对步骤(1)的网络数据包集合进行特征提取,包括以下步骤:
(2-1)按照设定的时间间隔,将网络数据包集合划分为多组;
(2-2)根据网络数据包集合中的长度和方向,将相同长度和方向的数据包合并为同一类别,统计每组网络数据包集合中的相同类别的数据包数量;
(2-3)分别计算每组网络数据包集合中的不同类别的数据包数量各占数据包数量总和的比例,将该比例记为网络数据包二元组的概率,从而得到不同类别数据包的概率分布,即该网络数据包集合的特征;
(3)遍历所有待识别物联网设备,返回步骤(1),得到与所有待识别物联网设备相对应的网络数据包集合的特征,形成一个网络数据包集合特征集;
(4)将步骤(3)的网络数据包集合特征集输入到k近邻分类器中,k近邻分类器的距离度量方式为全变差距离或海林格距离:
全变差距离:
海林格距离:
k近邻分类器输出待识别物联网设备类型的分类结果,实现基于包长概率分布与k近邻算法的物联网设备识别。
2.如权利要求1所述的物联网设备识别方法,其特征在于所述的步骤(3)与步骤(4)之间还包括以下步骤:
(1)将所述的网络数据包集合特征集输入DBSCAN聚类算法,DBSCAN聚类算法的距离度量方式与权利要求1步骤(4)中的k近邻分类器的距离度量方式相同,DBCSAN聚类算法输出特征集聚类后的网络数据包集合特征簇与特征离群点;
(2)计算上述步骤(1)中得到的每个簇的几何中心点;
(3)将上述步骤(1)中的特征离群点与步骤(2)中的几何中心点作为新的特征集输入到权利要求1的步骤(4)的k近邻分类器中。
3.一种基于包长概率分布与k近邻算法的物联网设备识别方法,其特征在于包括以下步骤:
(1)实时采集一个待识别物联网设备的流量,得到一个网络数据包集合,网络数据包集合中的元素为与网络数据包的长度和方向相对应的二元组;
(2)对步骤(1)的网络数据包集合进行特征提取,包括以下步骤:
(2-1)按照设定的时间间隔,将网络数据包集合划分为多组;
(2-2)根据网络数据包集合中的长度和方向,将相同长度和方向的数据包合并为同一类别,统计每组网络数据包集合中的相同类别的数据包数量;
(2-3)分别计算每组网络数据包集合中的不同类别的数据包数量各占数据包数量总和的比例,将该比例记为网络数据包二元组的概率,从而得到不同类别数据包的概率分布,即该网络数据包集合的特征;
(3)遍历所有待识别物联网设备,返回步骤(1),得到与所有待识别物联网设备相对应的网络数据包集合的特征,形成一个网络数据包集合特征集;
(4)对步骤(2)的网络数据包集合的特征进行标记,标记内容为产生物联网流量的待识别物联网设备的类型;
(5)遍历所有待识别物联网设备,重复步骤(1)、步骤(2)和步骤(4),得到与所有待识别物联网设备相对应的网络数据包集合的特征,形成一个包含待识别物联网设备类型的网络数据包集合特征集;
(6)将上述步骤(3)的网络数据包集合特征集和步骤(5)的包含待识别物联网设备类型的网络数据包集合特征集输入到k近邻分类器中,k近邻分类器的距离度量方式为全变差距离或海林格距离:
全变差距离:
海林格距离:
k近邻分类器输出步骤(3)的网络数据包集合特征集的分类结果;
(7)将步骤(6)的网络数据包集合特征集的分类结果作为步骤(3)的网络数据包集合特征集的标记,得到一个包含待识别物联网设备类型的网络数据包集合特征集;
(8)将步骤(5)的包含待识别物联网设备类型的网络数据包集合特征集和步骤(7)的包含待识别物联网设备类型的网络数据包集合特征集合并,得到一个最终网络数据包集合特征集;
(9)将步骤(8)的最终网络数据包集合特征集输入到步骤(6)的k近邻分类器中,输出得到识别结果,实现基于包长概率分布与k近邻算法的物联网设备识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011506245.3/1.html,转载请声明来源钻瓜专利网。