[发明专利]用于信息系统入侵检测的在线单分类主动机器学习方法有效
申请号: | 201910142435.2 | 申请日: | 2019-02-26 |
公开(公告)号: | CN109995756B | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 李光夏;刘佳;沈玉龙;党永超 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;G06K9/62 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 黄伟洪 |
地址: | 710071 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 信息系统 入侵 检测 在线 分类 主动 机器 学习方法 | ||
1.一种用于信息系统入侵检测的在线单分类主动机器学习方法,其特征在于,所述用于信息系统入侵检测的在线单分类主动机器学习方法包括:
第一步,使用信息系统中较易获得且数量最多的一类数据对分类器进行初始化;
第二步,对于信息系统中实时数据,根据所得初始分类器模型,对实时数据的属性类型根据一定策略给出预测,同时,若满足某种条件,请求专家给出专业判定,并对分类器模型做出更新;对于信息系统中实时数据,根据所得初始分类器模型,对实时数据的属性类型根据一定策略给出预测,同时,若满足某种条件,对分类器模型做出更新;具体包括:在时刻t,对于信息系统中实时数据xt,根据所得初始分类器模型w,对xt的属性类型根据一定策略给出预测;同时,若满足某种条件,对分类器模型w做出更新;设置未标记池为一个容量为N的队列,用于存储最多N个在不同时刻t的数据xt;初始化未标记池为空;
进一步包括:
(1)在时刻t,对于信息系统中实时数据xt,根据所得初始分类器模型w,计算临时值ft=||w-xt||,并判断若ft>epsilon,则给出实时数据xt的预测标签为1,即该数据为异常数据;其中,epsilon为用户设定的参数,为大于零的实数,表示包括多数类数据的超球体的半径;
(2)若当前未标记池小于其最大容量且当前预测值正确时,将实时数据xt及临时值ft的组合存入未标记池中;
(3)每隔一定时刻t′,取出未标记池中最大的ft及其对应的xt,请求相关领域专家判断xt的数据类型是否为异常类型,其中,ft的值越大,代表分类器将此条数据视为异常类型的置信度更高,是更有价值、更值得请专家进行判定的数据;此时,若专家给出与分类器相反的结论,则执行第三步更新分类器模型;第三步结束后继续执行(1);
第三步,更新分类器模型。
2.如权利要求1所述的用于信息系统入侵检测的在线单分类主动机器学习方法,其特征在于,所述第一步使用信息系统中较易获得且数量最多的一类数据对分类器进行初始化包括:
(1)输入数据共有n个,每个为1×d维向量,对于所有输入数据构成的n×d维矩阵X,使用随机种子产生X的乱序排列X′;设初始模型w为1×d维向量,赋其初值为1×d维随机数;
(2)依次判断输入数据X′中每一个实例,即1×d维向量x,判断其是否为多数类数据:若是,则执行第三步;否则执行(2);
(3)判断当前数据样本集中所有的样本是否已全部被处理完毕,即判断数据样本X′是否全部经过上述计算步骤;若是,则执行第二步;若否,则执行(2)。
3.如权利要求1所述的用于信息系统入侵检测的在线单分类主动机器学习方法,其特征在于,所述第三步的分类器模型的更新方式为:
(1)根据以下公式(1)计算临时值l,若l>0,则执行(2),否则结束;
l=||w-x||-epsilon (1)
其中,||w-x||为(w-x)的二范数;
(2)根据以下公式(2)更新初始模型w;
4.一种应用权利要求1~3任意一项所述用于信息系统入侵检测的在线单分类主动机器学习方法的机器学习平台。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910142435.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于小程序架构的登录状态的控制方法及装置
- 下一篇:访问控制系统