[发明专利]基于隔离算法的异常数据检测方法在审

专利信息
申请号: 202210012865.4 申请日: 2022-01-07
公开(公告)号: CN114356947A 公开(公告)日: 2022-04-15
发明(设计)人: 宋思楠;蔡江辉;杨海峰 申请(专利权)人: 太原科技大学
主分类号: G06F16/23 分类号: G06F16/23;G06F16/2458;G06F21/56
代理公司: 北京沃知思真知识产权代理有限公司 11942 代理人: 周俊华
地址: 030024 山西省太*** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 隔离 算法 异常 数据 检测 方法
【说明书】:

本发明公开了基于隔离算法的异常数据检测方法,属于数据处理技术领域,该检测方法具体步骤如下:(1)收集并筛选数据;(2)构建学习神经网络以进行参数设置;(3)对数据进行数据隔离;(4)对异常数据进行溯源处理并记录;(5)修复异常数据并反馈用户;本发明无需人工设置参数且不需要人工建模,能够方便用户对计算机中的异常数据进行检测,提高用户异常处理效率,操作简单,能够快速对不符合许可规则的软件进行中断处理,有效的保证计算机的安全性,同时节省用户处理方案设计时间。

技术领域

本发明涉及数据处理技术领域,尤其涉及基于隔离算法的异常数据检测方法。

背景技术

在数据挖掘中,异常检测对不匹配预期模式或数据集中其他项目的项目、事件或观测值的识别,通常异常项目会转变成银行欺诈、结构缺陷、医疗问题、文本错误等类型的问题,异常也被称为离群值、新奇、噪声、偏差和例外,特别是在检测滥用与网络入侵时,有趣性对象往往不是罕见对象,但却是超出预料的突发活动,这种模式不遵循通常统计定义中把异常点看作是罕见对象,于是许多异常检测方法将对此类数据失效,除非进行了合适的聚集,相反,聚类分析算法可能可以检测出这些模式形成的微聚类;因此,发明出基于隔离算法的异常数据检测方法变得尤为重要;

经检索,中国专利号CN202110815076.X公开了数据异常检测方法,该发明虽然能够快速精准定位到数据异常,实现了对于业务核心指标的智能预警能力,但是需要人工设置参数以及人工建模,不方便用户对计算机中的异常数据进行检测;此外,现有的基于隔离算法的异常数据检测方法违规软件处理效率慢,无法有效的保证计算机的安全性;为此,我们提出基于隔离算法的异常数据检测方法。

发明内容

本发明的目的是为了解决现有技术中存在的缺陷,而提出的基于隔离算法的异常数据检测方法。

为了实现上述目的,本发明采用了如下技术方案:

基于隔离算法的异常数据检测方法,该检测方法具体步骤如下:

(1)收集并筛选数据:对计算机数据进行收集,并对收集的数据进行数据分类,同时分别生成数据黑名单以及数据白名单对数据进行记录,同时对两组名单数据进行实时更新;

(2)构建学习神经网络以进行参数设置:将数据黑名单上的数据分为训练集和测试集,并通过训练样本对学习神经网络进行训练,再用测试样本对训练得到的学习神经网络进行数据验证,并获取最佳参数;

(3)对数据进行数据隔离:参数设置完成后,构建隔离模型并将参数导入隔离模型中,同时将数据黑名单中的数据导入隔离模型中进行隔离检测,并将其中检测出的异常数据进行记录,同时构建风险管控数据库对相关软件进行监控;

(4)对异常数据进行溯源处理并记录:依次对检测出的异常数据进行数据溯源,并对溯源结果进行判断分类,同时对分类完成的异常数据进行二次分析,并将分析结果反馈给用户;

(5)修复异常数据并反馈用户:对风险指数高的异常数据进行数据修复处理,同时生成修复日志,并将修复日志上传至云端服务器进行存储,将修复信息上传至共享平台进行数据共享。

作为本发明的进一步方案,步骤(1)中所述数据分类具体步骤如下:

步骤一:收集计算机中所有软件数据,并将其按照系统软件数据以及应用软件数据进行分类;

步骤二:将系统软件数据录入数据白名单中,将应用软件数据录入数据黑名单中,同时将相关软件名称分别录入两组名单中;

步骤三:将两组名单记录的软件名称按照名称首字母A~Z进行排序,同时将各组软件数据与相关软件名称进行关联。

作为本发明的进一步方案,步骤(2)中所述数据验证具体步骤如下:

第一步:统计数据黑名单中的数据总量n,并从中中选择一个数据作为验证数据;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原科技大学,未经太原科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210012865.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top