[发明专利]一种基于不确定数据集的离群检测方法在审

专利信息
申请号: 201510676188.6 申请日: 2015-10-19
公开(公告)号: CN105373806A 公开(公告)日: 2016-03-02
发明(设计)人: 刘文婷 申请(专利权)人: 河海大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 南京纵横知识产权代理有限公司 32224 代理人: 董建林
地址: 210098 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 不确定 数据 离群 检测 方法
【权利要求书】:

1.一种基于不确定数据集的离群检测方法,其特征在于,包括以下步骤:。

步骤一,)计算不确定数据集D中每个数据点o的k距离和k距离邻域;

步骤二,计算k距离邻域中数据点q成为数据点o的近邻的概率;

步骤三,计算k距离邻域中每个数据点q到数据点o的可达距离和概率密度函数;

步骤四,计算每个数据点o的可达密度;

步骤五,计算每个数据点o的离群因子,确定离群点。

2.根据权利要求1所述的基于不确定数据集的离群检测方法,其特征在于,所述步骤一包括以下步骤:

1-1)形式化数据集;

不确定数据集D表示为D={o1,o2,...oi...,on},n表示不确定数据集D大小,其中oi表示数据集中的一个数据点,每个数据点有d个维度,即d个属性值每个属性都关联一个概率密度函数和累加分布函数则数据点oi表示为:

1-2)确定数据点o的k距离k_dist_ε(o);

k距离表示不确定数据集D中,对应每个数据点o的最小距离值,在k距离范围内存在至少k个最近邻域的概率不小于ε,记为k_dist_ε(o),其中k为正整数,ε∈(0,1];

1-3)定义数据点o的k距离邻域Nk_dist_ε(o);

k距离邻域表示在不确定数据集D中,与数据点o的最小距离小于k_dist_ε(o)的点的集合,表示为Nk_dist_ε(o):

Nk_dist_ε(o)={q|min_dist(q,o)<k_dist_ε(o)},

其中min_dist(q,o)表示k距离邻域中数据点q的分布范围与数据点o的分布范围的最小间隔;

1-4)采用迭代算法计算k距离k_dist_ε(o):

令po(k_d)表示数据点o在距离k_d∈(0,Rmax]范围内至少有k个邻域的概率,当k_d=k_dist_ε时,po(k_d)=ε;Rmax表示不确定数据集中两个数据点之间的最大距离;

a)初始化:

不确定数据集中两个数据点o之间的最小距离为0,用low表示,不确定数据集中两个数据点o之间的最大距离为Rmax,用up表示,因此,确定不确定数据集中两个数据点之间的距离k_d取值范围为(low,up],取中间值作为k_d的初始值,即k_d=(low+up)/2,并设定k距离邻域Nk_dist_ε(o)初始值为空集Φ,具体表示如下:

Nk_dist_ε(o)=Φ;low=0;up=Rmax;k_d=(low+up)/2

b)计算k距离k_dist_ε(o):

当|po(k_d)-ε|≥δ时,若po(k_d)<ε,则low=k_d,否则up=k_d;令k_d=(low+up)/2,直到|po(k_d)-ε|<δ成立,可以得出k_dist_ε(o)=k_d;

c)计算k距离邻域Nk_dist_ε(o):

对于不确定数据集中除数据点o外任意数据点p,若满足条件max_dist(p,o)<k_dist_ε(o),则Nk_dist_ε(o)=Nk_dist_ε(o)∪{p},即表示把p插入到k距离邻域Nk_dist_ε(o),其中,max_dist(p,o)表示k距离邻域中数据点p的分布范围与数据点o的分布范围的最大间隔。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510676188.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top