[发明专利]审计异常数据检测方法及装置在审
申请号: | 202111646279.7 | 申请日: | 2021-12-29 |
公开(公告)号: | CN114356989A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 叶勇飞;匡石磊 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/248;G06K9/62 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 余娜;臧建明 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 审计 异常 数据 检测 方法 装置 | ||
1.一种审计异常数据检测方法,其特征在于,包括:
将待审计数据转为向量形式的数据点,以得到数据集;所述数据集中包含多个所述数据点;
基于第一聚类结果的第一聚类中心点,判定所述数据集中疑似异常的所述数据点为疑似异常数据点;所述第一聚类结果为历史审计数据中K-Means聚类模型的最优聚类结果;
基于所述第一聚类中心点,对所述数据集进行单次K-means聚类,得到第二聚类中心点;
计算所述第一聚类中心点与所述第二聚类中心点的偏移量,若所述偏移量小于阈值,则确定所述疑似异常数据点为异常数据点;
输出所述异常数据点。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一聚类中心点,对所述数据集进行单次K-means聚类,确定第二聚类中心点,包括:
提取所述历史审计数据中K-Means聚类模型的所述第一聚类结果的所述第一聚类中心点;
基于所述第一聚类中心点,对所述数据集进行单次K-Means聚类得到第二聚类结果,确定所述第二聚类中心点;所述第二聚类结果为单次计算的K-Means聚类结果。
3.根据权利要求1所述的方法,其特征在于,所述基于第一聚类结果的第一聚类中心点,判定所述数据集中疑似异常的所述数据点为疑似异常数据点,包括:
基于所述第一聚类中心点,计算所述数据集中数据点的点密度与标准欧式距离;
计算所述数据集的密度指数以及距离均和;
若目标数据点的点密度小于所述密度指数,且所述目标数据点的标准欧式距离大于所述距离均和,则确定所述目标数据点为所述疑似异常数据点;所述目标数据点为所述数据集中的任意数据点;
遍历所述数据集中数据点,直至获取到所述数据集中全部的所述疑似异常数据点。
4.根据权利要求1所述的方法,其特征在于,还包括:
若所述偏移量大于或等于所述阈值,则基于所述数据集进行K-means聚类得到第三聚类结果;所述第三聚类结果为循环计算的K-Means聚类结果;
基于所述第三聚类结果的第三聚类中心点确定所述数据集中的所述异常数据点。
5.根据权利要求4所述的方法,其特征在于,还包括:
将所述第三聚类结果更新为所述历史审计数据中K-Means聚类模型的最优聚类结果。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述输出所述异常数据点,包括:
定义所述异常数据点的数据检测结果的输出形式,所述输出形式包括:表格及可视化图标;
将所述数据检测结果以所述表格及所述可视化图表的形式输出。
7.根据权利要求1-5任一项所述的方法,其特征在于,所述将待审计数据转向量成数据点之前,还包括:
接收审计异常数据检测指令;
通过数据传输协议实现与第三方数据源对接;
从所述第三方数据源中采集所述待审计数据。
8.一种审计异常数据检测装置,其特征在于,包括:
数据采集接入模块,用于将待审计数据转为向量形式的数据点,以得到数据集;所述数据集中包含多个所述数据点;
数据异常标识模块,用于基于第一聚类结果的第一聚类中心点,判定所述数据集中疑似异常的所述数据点为疑似异常数据点;所述第一聚类结果为历史审计数据中K-Means聚类模型的最优聚类结果;
数据特征验证模块,用于基于所述第一聚类中心点,对所述数据集进行单次K-means聚类,得到第二聚类中心点;
计算所述第一聚类中心点与所述第二聚类中心点的偏移量,若所述偏移量小于阈值,则确定所述疑似异常数据点为异常数据点;
数据检测结果输出模块,用于输出所述异常数据点。
9.一种终端设备,其特征在于,包括:存储器和处理器;
所述存储器用于存储计算机指令;所述处理器用于运行所述存储器存储的所述计算机指令实现权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111646279.7/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置