[发明专利]一种基于SVM的被动操作系统识别方法、存储介质及设备在审
申请号: | 202010773437.4 | 申请日: | 2020-08-04 |
公开(公告)号: | CN112115965A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 范建存;陈浩男;罗新民 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 高博 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 svm 被动 操作系统 识别 方法 存储 介质 设备 | ||
1.一种基于SVM的被动操作系统识别方法,其特征在于,包括以下步骤:
S1、分析p0f指纹库规则,确定训练数据集和测试数据集;
S2、对步骤S1确定的训练数据集和测试数据集进行预处理;
S3、将步骤S2预处理后的训练数据集和测试数据集由数值变量转换为类别变量,再进行OneHot编码;
S4、采用Gauss核函数,以步骤S3中OneHot编码后的训练数据集构建最优超平面,输入SVM算法模型,采用RBF核函数训映射指纹数据至高维空间,通过计算最优超平面构建SVM分类器,构造特征空间的分类超平面;
S5、取步骤S3中OneHot编码后中的测试数据集,经数据预处理后通过SVM算法模型得出预测结果,计算真实流量的测试精度;
S6、采集步骤S5的真实流量数据,然后经步骤S2和S3处理后,筛选其中p0f指纹库中缺失的数据,将缺失数据加入训练数据集,经步骤S4重新训练后,得到真实流量增量训练后的SVM分类器,通过SVM分类器完成识别。
2.根据权利要求1所述的基于SVM的被动操作系统识别方法,其特征在于,步骤S1中,选取指纹库的特定字段N维并筛选适用现阶段网络环境的指纹数据,加上操作系统类别标记后作为训练数据集;通过流量采集工具在互联网网关分时段采集真实流量数据包,存储为.pcap格式作为测试数据集。
3.根据权利要求1所述的基于SVM的被动操作系统识别方法,其特征在于,步骤S2具体为:
S201、将步骤S1得到的N维数据进行量化操作,将每一维度去重后取出,按照数字顺序排列,将排序后的数据按照其总量n量化成从0-n维数据;
S202、将pcap数据包采用python解析提取对应指纹字段,采用量化方式将所有解析后的指纹量化。
4.根据权利要求1所述的基于SVM的被动操作系统识别方法,其特征在于,步骤S4中,采用Gauss核函数构建最优超平面如下:
其中,X为N维输入空间的向量,Xp为除X外的任意其他样本,σ为样本方差。
5.根据权利要求1所述的基于SVM的被动操作系统识别方法,其特征在于,步骤S5中,采用同一IP多条预测结果少数服从多数的原则进行最终预测结果判定。
6.一种存储一个或多个程序的计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行根据权利要求1至5所述的方法中的任一方法。
7.一种计算设备,其特征在于,包括:
一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1至5所述的方法中的任一方法的指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010773437.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种单相19电平逆变器单元拓扑
- 下一篇:一种基于柔性卷积的单目标跟踪方法