[发明专利]基于多层邻域划分的异常检验方法和装置在审
申请号: | 201810682469.6 | 申请日: | 2018-06-27 |
公开(公告)号: | CN110647899A | 公开(公告)日: | 2020-01-03 |
发明(设计)人: | 闫壮 | 申请(专利权)人: | 广东神马搜索科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 11205 北京同立钧成知识产权代理有限公司 | 代理人: | 杨泽;刘芳 |
地址: | 510627 广东省广州市天河区黄埔大*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多层 邻域 异常检验 待检测数据 数据点 异常点 有效地 方法和装置 表征数据 序列对数 序列确定 构建 群体 自动化 敏感 全局 | ||
1.一种基于多层邻域划分的异常检验方法,其特征在于,包括:
获取待检测数据集中的多个数据点;
根据每个数据点与所述待检测数据集中的其他数据点的位置关系确定每个数据点的有序距离序列;
根据所述有序距离序列确定与所述数据点相对应的多层邻域以及与所述多层邻域相对应的多层邻域序列;
根据所述多层邻域序列对所述数据点进行异常检验。
2.根据权利要求1所述的方法,其特征在于,根据所述有序距离序列确定与所述数据点相对应的多层邻域以及与所述多层邻域相对应的多层邻域序列,包括:
获得所述有序距离序列中的多个距离转折点;
根据所述距离转折点确定所述多层邻域以及所述多层邻域序列。
3.根据权利要求2所述的方法,其特征在于,根据所述距离转折点确定所述多层邻域序列,包括:
获取所述距离转折点的序列位置和转折距离;
根据所述序列位置和转折距离确定所述多层邻域序列。
4.根据权利要求3所述的方法,其特征在于,根据所述多层邻域序列对所述数据点进行异常检验,包括:
将所述多层邻域序列中的序列位置和转折距离分别与预先设置的序列阈值位置和转折阈值距离进行分析比较;
若所述序列位置小于所述序列阈值位置,且所述转折距离大于所述转折阈值距离,则确定所述数据点为异常数据点;或者,
若所述序列位置大于或等于所述序列阈值位置,和/或,所述转折距离小于或等于所述转折阈值距离,则确定所述数据点为正常数据点。
5.根据权利要求1所述的方法,其特征在于,所述根据每个数据点与所述待检测数据集中的其他数据点的位置关系确定每个数据点的有序距离序列,包括:
获取所述数据点的数据类型;
根据所述数据类型确定所述数据点与所述待检测数据集中的其他数据点之间的距离类型;
根据所述距离类型确定所述数据点的有序距离序列。
6.根据权利要求5所述的方法,其特征在于,
所述数据类型包括以下至少之一:多维连续数值型、离散型、定长序列;
所述距离类型包括以下至少之一:欧氏距离、余弦距离、杰卡德距离、海明距离、自定义距离。
7.根据权利要求1-6中任意一项所述的方法,其特征在于,所述有序距离序列为待检测数据集中的数据点与其他数据点的距离按照预设规则进行排列的序列,所述预设规则包括:从大到小规则、从小到大规则。
8.一种基于多层邻域划分的异常检验装置,其特征在于,包括:
获取模块,用于获取待检测数据集中的多个数据点;
确定模块,用于根据每个数据点与所述待检测数据集中的其他数据点的位置关系确定每个数据点的有序距离序列;
处理模块,用于根据所述有序距离序列确定与所述数据点相对应的多层邻域以及与所述多层邻域相对应的多层邻域序列;
检验模块,用于根据所述多层邻域序列对所述数据点进行异常检验。
9.根据权利要求8所述的装置,其特征在于,所述处理模块,用于:
获得所述有序距离序列中的多个距离转折点;
根据所述距离转折点确定所述多层邻域以及所述多层邻域序列。
10.根据权利要求9所述的装置,其特征在于,所述处理模块,用于:
获取所述距离转折点的序列位置和转折距离;
根据所述序列位置和转折距离确定所述多层邻域序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东神马搜索科技有限公司,未经广东神马搜索科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810682469.6/1.html,转载请声明来源钻瓜专利网。