[发明专利]基于加权距离度量以及矩阵分解的入侵检测方法及装置有效
申请号: | 201410750891.2 | 申请日: | 2014-12-09 |
公开(公告)号: | CN104484601B | 公开(公告)日: | 2018-03-20 |
发明(设计)人: | 张爽;张涌;宁立 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06F21/55 | 分类号: | G06F21/55 |
代理公司: | 深圳中一专利商标事务所44237 | 代理人: | 张全文 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 加权 距离 度量 以及 矩阵 分解 入侵 检测 方法 装置 | ||
技术领域
本发明属于信息安全技术领域,尤其涉及一种基于加权距离度量以及矩阵分解的入侵检测方法及装置。
背景技术
入侵检测(Intrusion Detection,ID)的研究与发展已经有20余年的历史,国内外学者已提出大量的入侵检测方法,如统计方法、贝叶斯推理方法、机器学习方法、神经网络、数据挖掘、遗传算法、支持向量机等方法。但上述方法都存在一个缺点,即对建立检测模型的训练数据要求较高:必须是“干净”的数据并且必须包含检测对象的大多数正常行为,而同时做到这两点是非常困难的。因此,近年研究人员将聚类的方法用于入侵检测,以达到检测异常数据的作用。
然而,现有应用到入侵检测中的聚类方法,对于数据挖掘中距离度量方面都是采取原始的欧拉距离度量方法,没有考虑整个数据集的特性以及各数据集属性之间量纲的差异,对噪声数据敏感,影响检测结果。
发明内容
鉴于此,本发明实施例提供一种基于加权距离度量以及矩阵分解的入侵检测方法及装置,以解决现有技术没有考虑整个数据集的特性以及各数据集属性之间量纲的差异,对噪声数据敏感,导致检测效果较差的问题。
一方面,本发明实施例提供一种基于加权距离度量以及矩阵分解的入侵检测方法,所述方法包括:
对原始数据集进行预处理,获得高维向量组;
基于随机梯度下降的矩阵分解算法对获得的所述高维向量组进行降维处理,获得低维向量组;
对获得的所述低维向量组进行加权闵可夫斯基距离度量;
基于所述加权闵可夫斯基距离度量和预定的聚类算法对预处理后的数据集进行检测,获得检测结果。
另一方面,本发明实施例提供一种基于加权距离度量以及矩阵分解的入侵检测装置,所述装置包括:
预处理单元,用于对原始数据集进行预处理,获得高维向量组;
降维单元,用于基于随机梯度下降的矩阵分解算法对获得的所述高维向量组进行降维处理,获得低维向量组;
加权距离度量单元,用于对获得的所述低维向量组进行加权闵可夫斯基距离度量;
检测单元,用于基于所述加权闵可夫斯基距离度量和预定的聚类算法对预处理后的数据集进行检测,获得检测结果。
本发明实施例与现有技术相比存在的有益效果是:1)将随机梯度下降的矩阵分解算法应用到入侵检测中,通过对高维向量组使用随机梯度下降的矩阵分解算法进行数据归约,可以将与数据挖掘任务不相关或冗余的属性删除,找出最小属性集。一方面使得簇类的概率分布尽可能地接近使用所有属性得到的原分布,一方面使得后续的聚类算法计算速度获得较大提升;2)对不同量纲和不同值域信息的属性差异进行考量,将权值应用到闵可夫斯基距离度量中,从而既考虑了整个数据集的特性,又消除了各数据集属性之间量纲的差异,并且在一定程度上减弱了噪声数据对距离度量的影响。将加权闵可夫斯基距离度量应用到入侵检测中,对复杂的数据集,可以在进行相似度度量的过程中呈现出更优的性能;3)基于加权闵可夫斯基距离度量和指定聚类算法一起对经过预处理后的数据集聚类,将相似数据划分到同一个簇中,将相异的数据划分到不同的簇中,从而可有效检测出异常簇,具有较强的易用性和实用性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的基于加权距离度量以及矩阵分解的入侵检测方法的实现流程图;
图2是本发明实施例二提供的基于加权距离度量以及矩阵分解的入侵检测装置的组成结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
实施例一:
图1示出了本发明实施例一提供的基于加权距离度量以及矩阵分解的入侵检测方法的实现流程,该方法过程详述如下:
在步骤S101中,对原始数据集进行预处理,获得高维向量组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410750891.2/2.html,转载请声明来源钻瓜专利网。