[发明专利]一种基于双参数离群因子的离群点检测方法在审

专利信息
申请号: 201810675516.4 申请日: 2018-06-27
公开(公告)号: CN109063733A 公开(公告)日: 2018-12-21
发明(设计)人: 周红芳;刘虹江;张英杰;张尧;刘艺彬;奚冰彦 申请(专利权)人: 西安理工大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 西安弘理专利事务所 61214 代理人: 杜娟
地址: 710048*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 双参数 离群点检测 计算数据 集合 步骤实施 降序排列 空间分布 全局距离 数据点 数据集 检测 收敛 应用
【权利要求书】:

1.一种基于双参数离群因子的离群点检测方法,其特征在于,具体按照以下步骤实施:

步骤1,给定一个空间分布数据集χ={X1,X2,...XN},其中Xi∈Rd,i=1,2,...N,计算数据集中每一个数据点Xi的局部密度ρ(Xi),并将每个数据点Xi的局部密度按大小降序排列,形成一个密度集合

步骤2,根据步骤1的密度集合计算数据集中每一个数据点Xi的全局距离d(Xi);

步骤3,求取密度距离双参数离群因子

步骤4,判断是否为离群点,若DDPOS(Xi)的值等于1或者收敛于1那么点Xi就是一个正常的数据点,否则判断其为离群点。

2.根据权利要求1所述的一种基于双参数离群因子的离群点检测方法,其特征在于,所述步骤1中数据集中每一个数据点Xi的局部密度ρ(Xi)的计算方法为:其中为核函数,dc为数据点Xi的截断距离,||Xi-Xj||是Xi与Xj之间的欧几里得距离,则

3.根据权利要求2所述的一种基于双参数离群因子的离群点检测方法,其特征在于,所述数据点Xi的截断距离dc的计算方法为:计算数据点Xi与数据集中其余点的欧几里得距离,然后将计算的欧几里得距离升序排列选出前K个不重复的距离中最大的距离作为数据点Xi的截断距离。

4.根据权利要去1所述的一种基于双参数离群因子的离群点检测方法,其特征在于,所述步骤2全局距离d(Xi)的计算公式如下:

其中,Si代表包括对象Xi的前K个对象集合,d(Xi)代表了对象Xi与Xj的平均距离,就是全局距离,并且对象Xi的密度要大于对象Xj的密度,limε=0。

5.根据权利要去4所述的一种基于双参数离群因子的离群点检测方法,其特征在于,在计算全局距离d(Xi)时,当Xi前面的包括Xi的对象少于K个时,则无法满足前K个对象的平均距离,不足的使用0填充。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810675516.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top