[发明专利]一种异常组合数据的检测方法及装置有效
申请号: | 201710073592.3 | 申请日: | 2017-02-10 |
公开(公告)号: | CN106850632B | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 宗志远;卢明樊 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张小娜;王宝筠 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 异常 组合 数据 检测 方法 装置 | ||
本发明公开了一种异常组合数据的检测方法及装置,所述方法包括:获取待检测的数据组合项;将所述待检测的数据组合项与频繁组合数据库中的各个频繁组合项进行匹配;若存在匹配结果,则确定所述待检测的数据组合项为异常组合项,若不存在匹配结果,则确定所述待检测的数据组合项不是异常组合项。通过本发明,能够提高异常组合数据的检测速度。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种异常组合数据的检测方法及装置。
背景技术
在信息安全领域,需要特别关注的问题是,如何在海量数据中发现异常的行为。其中,在多维数据的异常检测中,有一类称为“组合异常”的问题,对于这类问题,往往同一种组合出现的次数越多,则认为该组合是异常组合的可能性越大,例如,在网站登录的风险检测中,如果某一相同组合(比如设备、IP、用户)被采用,以尝试进行多次的网站登录,这很有可能是一种异常行为,在安全领域,这种发生在登录时的异常行为被称为“撞库”行为。
然而,现有的异常组合检测方法,是凭借经验,人工从多种组合方式中找出可能的异常组合方式,并针对找出的每种组合分别进行聚合统计,以从大量组合数据中统计出每种组合出现的次数,并人工划定阈值,如果某种组合的出现次数大于该阈值,则认为该组合是一种频繁组合,进而认为该组合是异常组合,但是,这种基于人工操作的异常组合检测方式,耗时耗力,使得异常组合的检测效率比较低下。
发明内容
有鉴于此,本发明实施例的主要目的在于提供一种异常组合数据的检测方法及装置,能够提高异常组合数据的检测速度。
本发明实施例提供了一种异常组合数据的检测方法,包括:
获取待检测的数据组合项;
将所述待检测的数据组合项与频繁组合数据库中的各个频繁组合项进行匹配;
若存在匹配结果,则确定所述待检测的数据组合项为异常组合项,若不存在匹配结果,则确定所述待检测的数据组合项不是异常组合项。
可选的,所述频繁组合数据库按照以下方式形成:
获取数据组合样本集,所述数据组合样本集中包括至少一条数据组合样本;
分析各个数据组合样本之间的关联关系,确定所述数据组合样本是否为频繁组合项;
获取所有被确定为频繁组合项的数据组合样本,形成所述频繁组合数据库。
可选的,所述分析各个数据组合样本之间的关联关系,包括:
利用FPGrowth关联分析算法,分析各个数据组合样本之间的关联关系。
可选的,所述将所述待检测的数据组合项与频繁组合数据库中的各个频繁组合项进行匹配,包括:
遍历所述频繁组合数据库中的频繁组合项;
确定所述待检测的数据组合项中的数据元素个数,以及确定当前遍历到的频繁组合项中的数据元素个数;
判断两个组合项中的数据元素个数是否相同;
如果不同,则遍历下一频繁组合项,并执行上述确定数据元素个数的步骤;
如果相同,则判断两个组合项中的数据元素是否全部相同,如果是,则确定匹配成功并停止遍历,如果否,则继续遍历下一频繁组合项,并执行上述确定数据元素个数的步骤。
可选的,所述将所述待检测的数据组合项与频繁组合数据库中的各个频繁组合项进行匹配,包括:
确定所述待检测的数据组合项中的数据元素个数;
从所述频繁组合数据库中筛选出与所述数据元素个数相同的频繁组合项,并将筛选出的全部频繁组合项形成筛选组合集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710073592.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置