[发明专利]一种基于决策树的车载CAN总线异常检测方法在审
申请号: | 201910515204.1 | 申请日: | 2019-06-14 |
公开(公告)号: | CN110365648A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 黄杰;丁艳军 | 申请(专利权)人: | 东南大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L12/24;H04L12/40 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 康燕文 |
地址: | 211189 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 车载CAN总线 决策树 异常检测 检测 样本 预处理 异常检测模型 异常检测算法 决策树模型 训练样本集 测试样本 建立模型 模型效果 训练样本 预先获取 计算量 度量 报文 基尼 表现 | ||
1.一种基于决策树的车载CAN总线异常检测方法,其特征在于,包括以下步骤:
(1)对预先获取的车载CAN总线报文进行预处理,扩充样本;
(2)生成车载CAN总线报文属性,并标记报文的状态;
(3)生成车载CAN总线异常样本;
(4)划分车载CAN总线报文,得到训练样本和测试样本;
(5)将训练样本集输入到决策树模型中进行训练,生成车载CAN总线异常检测模型。
2.根据权利要求1所述的一种基于决策树的车载CAN总线异常检测方法,其特征在于,所述步骤(3)包括以下步骤:
(31)根据ID随机选择一个样本集合D;
(32)从样本集合D中随机的抽取一个样本d,统计每个字节的最大值和最小值,随机的改变数据域上的某一个或几个连续的字节,每个字节的取值范围是0~最小值和最大值~255,将改变后的样本d’放入新的集合E中;
(33)将样本d放回原始样本集合D中;
(34)重复步骤(32)和(33),直到生成的异常报文数量与正常报文的数据量相同。
3.根据权利要求1所述的一种基于决策树的车载CAN总线异常检测方法,其特征在于,所述按照50%异常样本和50%的正常样本的方式组合成测试报文样本和训练报文样本。
4.根据权利要求1所述的一种基于决策树的车载CAN总线异常检测方法,其特征在于,步骤(5)所述决策树模型是以CART算法生成的决策树模型,CART算法以基尼指数作为数据纯度的度量指标,基尼度公式为:
其中,D表示车载CAN总线报文样本集合,k表示车载CAN总线报文类别,k=1表示正常车载CAN总线报文样本,k=2表示异常车载总线报文样本,pk表示不同车载CAN总线类别的分布,p表示车载CAN总线报文正常样本的概率;
CAN总线报文数据的基尼指数定义为:
其中,D1和D2分别表示样本D按照特征A是否取某个可能值a划分出的两个子集合,|D1|和|D2|表示上述两个子集合包含的样本个数,|D|表示样本D的样本个数,属性A的CAN总线报文基尼指数越小表示属性A越适合作为最优划分属性。
5.根据权利要求1所述的一种基于决策树的车载CAN总线异常检测方法,其特征在于,所述步骤(5)包括以下步骤:
(51)计算某一属性对报文样本的CAN总线报文基尼指数;
(52)在所有可能的属性A以及它们所有可能的二值切分点a中,选择CAN总线报文基尼指数最小的属性及其对应的二值切分点作为此次用于属性划分的最优二值切分点和最优属性;
(53)根据最优二值切分点和最优属性将当前报文划分为两个子集合;
(54)递归的调用步骤(1)到(3),当没有可分的属性或者基尼指数为0停止调用,最终形成CAN总线决策树模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910515204.1/1.html,转载请声明来源钻瓜专利网。