[发明专利]一种基于机器学习的数据异常监测模型构建方法在审
申请号: | 201911078822.0 | 申请日: | 2019-11-06 |
公开(公告)号: | CN110851422A | 公开(公告)日: | 2020-02-28 |
发明(设计)人: | 刘泳锐;李建强;安黎东;李华;杜猛;温海滨;高志腾;王相 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心山西分中心 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/28;G06F21/32;G06K9/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 030000 *** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 数据 异常 监测 模型 构建 方法 | ||
本发明涉及一种基于机器学习的数据异常监测模型构建方法,考虑到单一特征分析结果的片面性和不足,在对平台业务数据的分析中,引入了皮尔逊相关系数和方差扩大因子来对不同特征进行特征提取,提取出合适的特征数据进入聚类模型,对提升模型准确率有很大的提升;并且针对聚类模型,选用K‑means算法的改进算法I‑K‑means算法模型,由于设计的主要目的是做异常处理,所以该算法不用将聚类进行到底再找异常,相比较于其它原始算法速度较快;综上基于机器学习建立的模型具有自学习、自演化的特性,可以适应复杂多变的网络环境,能够检测出未知异常,满足实时准确的需求。
技术领域
本发明涉及一种基于机器学习的数据异常监测模型构建方法,属于数据异常检测技术领域。
背景技术
当前煤炭、冶金、化工、机电等行业正面临自动化、数字化、智能化改造的关键时期,大量传统工业控制系统向工业互联网方向转型升级,信息安全形式日趋严峻。近年来网络安全事件频发,网络攻击愈演愈烈,网络安全防御技术相对比较滞后。在网络安全问题日益突出的今天,及时并有效的发现网络异常通信行为显得尤为重要。异常通信行为是指在网络环境中偏离正常数据的情形,当然正常行为也不是固定不变的,它是根据用户的操作、业务流程、网络管理的变化而变化的;传统的方法是通过静态规则匹配对网络异常行为进行检测,在动态、复杂的网络环境中难以检测未知异常和攻击类型,不能满足网络安全检测的要求。
发明内容
本发明所要解决的技术问题是提供一种基于机器学习的数据异常监测模型构建方法,基于机器学习建立的模型具有自学习、自演化的特性,可以适应复杂多变的网络环境,能够检测出未知异常,满足实时准确的需求。
本发明为了解决上述技术问题采用以下技术方案:本发明设计了一种基于机器学习的数据异常监测模型构建方法,用于获得工业互联网中目标应用所对应的数据异常监测模型,包括如下步骤:
步骤A.提取目标应用在目标历史时间段内通信流量所对应的各识别指纹特征,构建特征集合,然后进入步骤B;
步骤B.针对特征集合中的各识别指纹特征进行预处理,更新特征集合,然后进入步骤C;
步骤C.针对特征集合中的各识别指纹特征进行筛选,更新特征集合,然后进入步骤D;
步骤D.采用特征集合,针对预设指定聚类模型进行模型训练,获得训练后的模型,作为目标应用所对应的数据异常检测模型。
作为本发明的一种优选技术方案:还包括步骤E如下,执行完步骤D之后进入步骤E;
步骤E.针对目标应用所对应的数据异常检测模型,应用交叉验证法或网格搜索法,进行参数调整,更新数据异常检测模型。
作为本发明的一种优选技术方案:还包括步骤F如下,执行完步骤E之后进入步骤F;
步骤F.应用兰德指数算法和轮廓系数算法,针对数据异常检测模型进行评估。
作为本发明的一种优选技术方案:所述步骤B中,针对特征集合中的各识别指纹特征,依次进行数据清洗、数据标准化、数据归一化操作,实现对特征集合的预处理,然后进入步骤C;
其中,数据清洗,用于对特征集合中各识别指纹特征进行分析,找出各识别指纹特征中缺失的数据,对其进行数据填充,并将缺失数据占比大于预设比例阈值的识别指纹特征删除,由此实现对特征集合的更新;
数据标准化,用于对特征集合中各识别指纹特征进行标准化处理,获得各识别指纹特征之间的统一格式,实现对特征集合的更新;
数据归一化,用于针对特征集合中各识别指纹特征,应用Logistic函数方法进行归一化处理,实现对特征集合的更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心山西分中心,未经国家计算机网络与信息安全管理中心山西分中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911078822.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置