[发明专利]离群点检测方法和系统在审
申请号: | 201710497183.6 | 申请日: | 2017-06-26 |
公开(公告)号: | CN107315647A | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 徐骄 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G06F11/00 | 分类号: | G06F11/00;G06K9/62 |
代理公司: | 广州华进联合专利商标代理有限公司44224 | 代理人: | 刘艳丽 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 离群 检测 方法 系统 | ||
1.一种离群点检测方法,其特征在于,包括步骤:
获取待检测的样本空间,其中所述样本空间包括多个样本点,每个样本点包括若干个维度;
从所述样本空间选取若干个样本点作为对应簇的中心点;
计算所述样本空间中未被选取的每个样本点与各个中心点之间的距离权重,其中所述距离权重为样本点和中心点的数值相同的维度数与总维度数之比;
根据所述距离权重计算未被选取的每个样本点与各个中心点之间的距离;
根据所述距离确定未被选取的每个样本点所属的簇;
将不属于任何簇的样本点判定为离群点。
2.根据权利要求1所述的离群点检测方法,其特征在于,将不属于任何簇的样本点判定为离群点之后,还包括步骤:
计算每个簇的平均标准差,根据所述平均标准差获得每个簇的阈值;
获取每个簇中与对应中心点之间的距离大于阈值的样本点,将获取的样本点作为候选离群点;
对所有的候选离群点进行筛选,获得补充的离群点。
3.根据权利要求2所述的离群点检测方法,其特征在于,对所有的候选离群点进行筛选,获得补充的离群点包括:
将所有的候选离群点按照与中心点距离的大小进行排序,从距离最大的候选离群点开始选择预设个数的候选离群点作为补充的离群点。
4.根据权利要求2所述的离群点检测方法,其特征在于,计算每个簇的平均标准差包括:
根据簇所包含的样本点的总数量、簇所包含的每个样本点在每个维度的数值以及簇所包含的所有样本点在每个维度的均值,获得每个簇在每个维度的标准差;
计算每个簇所有维度的标准差的平均值,获得每个簇的平均标准差。
5.根据权利要求1至4任意一项所述的离群点检测方法,其特征在于,根据所述距离权重计算未被选取的每个样本点与各个中心点之间的距离包括:
根据样本点与中心点之间的距离权重的倒数、样本点的维度的数值以及中心点的维度的数值,计算未被选取的每个样本点与各个中心点之间的马氏距离。
6.根据权利要求1至4任意一项所述的离群点检测方法,其特征在于,根据所述距离确定未被选取的每个样本点所属的簇之后,将不属于任何簇的样本点判定为离群点之前,还包括步骤:
判断得到的簇是否满足设定的收敛条件;
若得到的簇不满足设定的收敛条件,重新选取每个簇的中心点,根据重新选取的各个中心点重新确定未被选取的每个样本点所属的簇。
7.根据权利要求6所述的离群点检测方法,其特征在于,确定未被选取的每个样本点所属的簇包括:
若距离某样本点最近的中心点仅有一个,将该样本点归入最近的中心点所在的簇,若距离某样本点最近的中心点有多个,不将该样本点归入任何簇。
8.一种离群点检测系统,其特征在于,包括:
样本空间获取模块,用于获取待检测的样本空间,其中所述样本空间包括多个样本点,每个样本点包括若干个维度;
中心点选取模块,用于从所述样本空间选取若干个样本点作为对应簇的中心点;
距离权重获得模块,用于计算所述样本空间中未被选取的每个样本点与各个中心点之间的距离权重,其中所述距离权重为样本点和中心点的数值相同的维度数与总维度数之比;
距离获得模块,用于根据所述距离权重计算未被选取的每个样本点与各个中心点之间的距离;
簇划分模块,用于根据所述距离确定未被选取的每个样本点所属的簇;
离群点检测模块,用于将不属于任何簇的样本点判定为离群点。
9.根据权利要求8所述的离群点检测系统,其特征在于,还包括与所述离群点检测模块相连的离群点补充模块,所述离群点补充模块包括:
阈值获得单元,用于计算每个簇的平均标准差,根据所述平均标准差获得每个簇的阈值;
候选离群点获得单元,用于获取每个簇中与对应中心点之间的距离大于阈值的样本点,将获取的样本点作为候选离群点;
补充离群点获得单元,用于对所有的候选离群点进行筛选,获得补充的离群点。
10.根据权利要求9所述的离群点检测系统,其特征在于,所述补充离群点获得单元将所有的候选离群点按照与中心点距离的大小进行排序,从距离最大的候选离群点开始选择预设个数的候选离群点作为补充的离群点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710497183.6/1.html,转载请声明来源钻瓜专利网。