[发明专利]基于隔离算法的异常数据检测方法在审
申请号: | 202210012865.4 | 申请日: | 2022-01-07 |
公开(公告)号: | CN114356947A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 宋思楠;蔡江辉;杨海峰 | 申请(专利权)人: | 太原科技大学 |
主分类号: | G06F16/23 | 分类号: | G06F16/23;G06F16/2458;G06F21/56 |
代理公司: | 北京沃知思真知识产权代理有限公司 11942 | 代理人: | 周俊华 |
地址: | 030024 山西省太*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 隔离 算法 异常 数据 检测 方法 | ||
1.基于隔离算法的异常数据检测方法,其特征在于,该检测方法具体步骤如下:
(1)收集并筛选数据:对计算机数据进行收集,并对收集的数据进行数据分类,同时分别生成数据黑名单以及数据白名单对数据进行记录,同时对两组名单数据进行实时更新;
(2)构建学习神经网络以进行参数设置:将数据黑名单上的数据分为训练集和测试集,并通过训练样本对学习神经网络进行训练,再用测试样本对训练得到的学习神经网络进行数据验证,并获取最佳参数;
(3)对数据进行数据隔离:参数设置完成后,构建隔离模型并将参数导入隔离模型中,同时将数据黑名单中的数据导入隔离模型中进行隔离检测,并将其中检测出的异常数据进行记录,同时构建风险管控数据库对相关软件进行监控;
(4)对异常数据进行溯源处理并记录:依次对检测出的异常数据进行数据溯源,并对溯源结果进行判断分类,同时对分类完成的异常数据进行二次分析,并将分析结果反馈给用户;
(5)修复异常数据并反馈用户:对风险指数高的异常数据进行数据修复处理,同时生成修复日志,并将修复日志上传至云端服务器进行存储,将修复信息上传至共享平台进行数据共享。
2.根据权利要求1所述的基于隔离算法的异常数据检测方法,其特征在于,步骤(1)中所述数据分类具体步骤如下:
步骤一:收集计算机中所有软件数据,并将其按照系统软件数据以及应用软件数据进行分类;
步骤二:将系统软件数据录入数据白名单中,将应用软件数据录入数据黑名单中,同时将相关软件名称分别录入两组名单中;
步骤三:将两组名单记录的软件名称按照名称首字母A~Z进行排序,同时将各组软件数据与相关软件名称进行关联。
3.根据权利要求1所述的基于隔离算法的异常数据检测方法,其特征在于,步骤(2)中所述数据验证具体步骤如下:
第一步:统计数据黑名单中的数据总量n,并从中中选择一个数据作为验证数据;
第二步:用数据黑名单中剩余的数据拟合一个测试模型,并用最先被排除的那个验证数据来验证测试模型的精度;
第三步:对测试模型的平均路径长度进行计算,其具体计算公式如下:
其中,c(n)代表平均路径长度,H(n-1)代表调和数,n代表数据黑名单中的数据总量。
4.根据权利要求3所述的基于隔离算法的异常数据检测方法,其特征在于,步骤(3)中所述隔离检测具体步骤如下:
S1.1:隔离模型随机选择一个属性A,并随机选择该属性的一个值V;
S1.2:根据属性A对每组数据进行分类,并递归的构建隔离树,同时分别构建MAX表以及MIN表;
S1.3:当A<V的软件数据录入MIN表中,当A≥C的软件数据录入MAX表中;
S1.4:对分类完成的数据进行预测,并对预测结果进行归一化处理,其具体计算公式如下:
其中,s(x,n)代表数据x在由n个数据构成的隔离树的异常指数,h(x)代表用来标准化数据x的路径长度,E(h(x))代表数据x在一批孤立树中的路径长度的期望;
S1.5:当E(h(x))→c(n)时,s→0.5,即数据x的路径平均长度与树的平均路径长度相近时,则不能区分是不是异常;当E(h(x))→0时,s→1,即x的异常分数接近1时,则判定为异常数据;当E(h(x))→n-1时,s→0,则判定为正常数据。
5.根据权利要求4所述的基于隔离算法的异常数据检测方法,其特征在于,步骤(4)中所述判断分类具体步骤如下:
S2.1:依据数据黑名单对异常数据对应的软件进行提取,并构建反馈名单记录各组软件名称;
S2.2:收集软件许可规则,并构建规则判断库,同时将反馈名单中的软件导入构建规则判断库中,将不符合许可规则的软件强制停止运行,并将各组软件运行状态录入数据黑名单中。
6.根据权利要求4所述的基于隔离算法的异常数据检测方法,其特征在于,步骤(5)中所述修复处理具体步骤如下:
S3.1:与方案共享平台通信连接,并提取相应处理方案,同时将提取出的处理方案反馈给用户;
S3.2:用户选择处理方案,计算机依据用户选择的处理方案对异常数据进行修复,并生成修复日志记录修复时间以及数据信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原科技大学,未经太原科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210012865.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:柔性显示模组及移动终端
- 下一篇:一种多域目标指示平台