[发明专利]一种基于报文特征的智能家居设备类型判定方法有效
申请号: | 201910112488.X | 申请日: | 2019-02-13 |
公开(公告)号: | CN109948650B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 何汉;瞿靓;邵中波;张峰;方黎明;刘亮 | 申请(专利权)人: | 南京中一物联科技有限公司 |
主分类号: | G06F18/2413 | 分类号: | G06F18/2413;G06F18/214;G06F21/57 |
代理公司: | 南京常青藤知识产权代理有限公司 32286 | 代理人: | 毛洪梅 |
地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 报文 特征 智能家居 设备 类型 判定 方法 | ||
1.一种基于报文特征的智能家居设备类型判定方法,其特征在于,包括以下步骤:
S1:生成设备指纹,在设备初始化连接过程中将数据报文进行特征化,每个设备指纹采用一个矩阵表示,矩阵每列为每个报文的特征,每行为一个特征在每个数据报文中的值,生成完整指纹;
S2:分类器生成,为每个已知设备指纹建立一个分类器,当一个设备指纹输入时,分类器均能得到一个二元分类结果表明该指纹数据是否匹配该设备类型;
S3:确定设备类型,当一个设备指纹输入时,如果该指纹只被一个分类器匹配,则该分类即为该设备的分类;如有多个设备分类器匹配到该设备指纹信息,则对于被多个分类器匹配的指纹,使用编辑距离算法,挑选出匹配度最高的设备类型,确定其设备类型;
对于每个设备,在完整指纹F中选取前十二个不同内容的报文,生成240(12×20)维的特征向量,生成固定指纹;
设备指纹分类器的生成采用固定指纹并包括以下步骤:
S21:定义包含多个设备类型的指纹集合,设备类型并挑选出设备类型的所有指纹,定义为;集合中剩下指纹,它们的设备类型,定义为;
S22:选取出来的样本集和样本集的子集,使用随机森林算法进行训练,得到设备类型对应的分类器;
S23:对于指纹集中的每个设备类型,重复步骤S21和S22,得到集合中的每个设备类型的分类器;
报文的特征类型包括链路层、网络层、传输层、应用层、IP选项、报文内容、IP 地址、端口,上述各层的协议是WIFI连接设备典型使用的网络协议,报文内容中引入报文大小特征,IP地址中引入目标IP地址数量特征,端口引入源端口和目标端口特征。
2.根据权利要求1所述的一种基于报文特征的智能家居设备类型判定方法,其特征在于,所述随机森林算法决策树包括以下步骤:
S231:用N来表示训练用例的个数,M表示特征数目;
S232:输入特征数目m,用于确定决策树上一个节点的决策结果,其中m小于M;
S233:从N个训练用例中以有放回抽样的方式,取样N次,形成一个训练集,并用未抽到的用例作预测,评估其误差;
S234:对于每一个节点,随机选择m个特征,决策树上每个节点的决定都是基于这些特征确定的,根据这m个特征,计算其最佳的分裂方式;
S235:每棵树都会完整成长而不会剪枝,形成决策树算法模型。
3.根据权利要求1所述的一种基于报文特征的智能家居设备类型判定方法,其特征在于,所述S3中如有多个设备分类器匹配到该设备指纹信息,则对于被多个分类器匹配的指纹,使用编辑距离算法,包括以下步骤:
S31:将设备指纹看作一个字符串,矩阵的每一列看作一个字符,将报文对应到编辑算法中,字符相等的含义就是报文中的所有特征与另一个报文相同;
S32:计算两个指纹的距离,看作两个字符串的距离,使用编辑距离算法,将计算得到的距离值除以较长的长度,使距离归一化到[0,1]的范围内;
S33:对匹配到的设备类型,随机选取样本集中的五个设备指纹值,计算与指纹的距离,重复步骤S32,然后对这些值求和得到最终的距离分数,选取距离分数最小的分类就是最终预测的分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京中一物联科技有限公司,未经南京中一物联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910112488.X/1.html,转载请声明来源钻瓜专利网。