[发明专利]一种基于双参数离群因子的离群点检测方法在审
申请号: | 201810675516.4 | 申请日: | 2018-06-27 |
公开(公告)号: | CN109063733A | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 周红芳;刘虹江;张英杰;张尧;刘艺彬;奚冰彦 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 杜娟 |
地址: | 710048*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 双参数 离群点检测 计算数据 集合 步骤实施 降序排列 空间分布 全局距离 数据点 数据集 检测 收敛 应用 | ||
1.一种基于双参数离群因子的离群点检测方法,其特征在于,具体按照以下步骤实施:
步骤1,给定一个空间分布数据集χ={X1,X2,...XN},其中Xi∈Rd,i=1,2,...N,计算数据集中每一个数据点Xi的局部密度ρ(Xi),并将每个数据点Xi的局部密度按大小降序排列,形成一个密度集合
步骤2,根据步骤1的密度集合计算数据集中每一个数据点Xi的全局距离d(Xi);
步骤3,求取密度距离双参数离群因子
步骤4,判断是否为离群点,若DDPOS(Xi)的值等于1或者收敛于1那么点Xi就是一个正常的数据点,否则判断其为离群点。
2.根据权利要求1所述的一种基于双参数离群因子的离群点检测方法,其特征在于,所述步骤1中数据集中每一个数据点Xi的局部密度ρ(Xi)的计算方法为:其中为核函数,dc为数据点Xi的截断距离,||Xi-Xj||是Xi与Xj之间的欧几里得距离,则
3.根据权利要求2所述的一种基于双参数离群因子的离群点检测方法,其特征在于,所述数据点Xi的截断距离dc的计算方法为:计算数据点Xi与数据集中其余点的欧几里得距离,然后将计算的欧几里得距离升序排列选出前K个不重复的距离中最大的距离作为数据点Xi的截断距离。
4.根据权利要去1所述的一种基于双参数离群因子的离群点检测方法,其特征在于,所述步骤2全局距离d(Xi)的计算公式如下:
其中,Si代表包括对象Xi的前K个对象集合,d(Xi)代表了对象Xi与Xj的平均距离,就是全局距离,并且对象Xi的密度要大于对象Xj的密度,limε=0。
5.根据权利要去4所述的一种基于双参数离群因子的离群点检测方法,其特征在于,在计算全局距离d(Xi)时,当Xi前面的包括Xi的对象少于K个时,则无法满足前K个对象的平均距离,不足的使用0填充。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810675516.4/1.html,转载请声明来源钻瓜专利网。