[发明专利]基于互信息和特征分组策略的高维异常检测预处理方法在审
申请号: | 202110633324.9 | 申请日: | 2021-06-07 |
公开(公告)号: | CN113419883A | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 黄月华;刘文芬;穆晓东;王中帅 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06K9/62 |
代理公司: | 桂林文必达专利代理事务所(特殊普通合伙) 45134 | 代理人: | 张学平 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 互信 特征 分组 策略 异常 检测 预处理 方法 | ||
1.一种基于互信息和特征分组策略的高维异常检测预处理方法,其特征在于,
包括:输入高维数据集;
计算数据集中每两个特征的互信息,得到互信息矩阵;
基于互信息矩阵生成子图集;
对子图集中的每个子图是否需要继续切割进行判断,若需要切割则引入NCut切图对子图采用递归的方法进行循环切割,直至不满足切割条件;若不满足切割条件则得到特征组;
将所有特征组组合成特征分组集。
2.如权利要求1所述的一种基于互信息和特征分组策略的高维异常检测预处理方法,其特征在于,
所述计算数据集中每两个特征的互信息,得到互信息矩阵的具体步骤是:
基于联合分布对任意两个特征进行处理,得到互信息;
计算所有特征两两间的互信息,得到互信息矩阵。
3.如权利要求2所述的一种基于互信息和特征分组策略的高维异常检测预处理方法,其特征在于,
所述基于联合分布对任意两个特征进行处理,得到互信息之后,所述计算所有特征两两间的互信息,得到互信息矩阵之前,所述步骤还包括对互信息进行归一化。
4.如权利要求1所述的一种基于互信息和特征分组策略的高维异常检测预处理方法,其特征在于,
所述基于互信息矩阵生成子图集的具体步骤是:
将互信息矩阵视为图的邻接矩阵,构建带权重的无向全连通图;
遍历全连通图所有节点,只保留与每个节点相连的权重最大的边,生成子图集。
5.如权利要求1所述的一种基于互信息和特征分组策略的高维异常检测预处理方法,其特征在于,
所述对子图集中的每个子图是否需要继续切割进行判断,若需要切割则引入NCut切图对子图采用递归的方法进行循环切割,直至不满足切割条件;若不满足切割条件则得到特征组的具体步骤是:
计算子图最弱边权重;
计算子图节点数占整体节点数的比例;
生成一个0到1之间的随机数;
若随机数在最弱边权重和比例之间,则基于NCut切图法对子图进行切图得到两个新图,并将两个新图放到子图集中;若随机数不在最弱边权重和比例之间,则得到特征组,并在子图集中删除相应子图;
对子图集中每个子图按上述步骤处理,直至子图集为空。
6.一种基于互信息和特征分组策略的高维异常检测方法,使用如权利要求1-5任意一项所述的一种基于互信息和特征分组策略的高维异常检测预处理方法,其特征在于,
包括:输入高维数据集;
使用基于互信息和特征分组策略的高维异常检测预处理方法对数据集进行特征分组,并将特征组组合得到特征分组集;
初始化总异常得分表;
每次从特征分组集中取出一个特征组,使用局部异常因子算法计算异常得分,并累加到总异常得分,直至特征分组集为空;
输出总异常得分列表的倒序排列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110633324.9/1.html,转载请声明来源钻瓜专利网。