[发明专利]基于FOLOF算法的运动员离群点解释方法及装置在审
申请号: | 202210326548.X | 申请日: | 2022-03-30 |
公开(公告)号: | CN114661795A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 周玉;朱文豪;夏浩;裴泽宣;吕灵灵;白磊;谭联;邴丕彬 | 申请(专利权)人: | 华北水利水电大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06K9/62 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 张立强 |
地址: | 450045 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 folof 算法 运动员 离群 解释 方法 装置 | ||
本发明公开一种基于FOLOF算法的运动员离群点解释方法及装置,该方法包括:通过FOLOF算法检测出运动员数据集中的离群点:首先使用肘部法则确定运动员数据集的最佳聚类个数;然后通过FCM的目标函数对运动员数据集进行剪枝,得到运动员离群点候选集;最后利用加权局部离群因子检测算法计算运动员离群点候选集中每个运动员离群点的离群程度,得到运动员离群点集;所述运动员数据集包括NBA球员数据集;通过黄金分割法将每个运动员离群点集中的运动员离群点的离群程度划分为不同等级,根据划分结果进行运动员离群点分析。本发明能够较好地解释运动员离群点的离群原因,挖掘其背后的意义。
技术领域
本发明属于运动员离群点挖掘技术领域,尤其涉及一种基于FOLOF算法的运动员离群点解释方法及装置。
背景技术
离群点是偏离大部分数据较远的点,它常被怀疑由不同的机制产生。离群点检测在数据处理中占有重要地位,它旨在挖掘数据集中有意义的潜在信息,是当下研究的热点。其在欺诈检测,网络入侵检测,市场分析,点云去噪和医疗诊断等方面已经有了广泛应用,其检测方法大致可以分为基于统计,基于距离,基于密度和基于聚类的方法。除了离群点检测外,离群点分析也是离群挖掘的重要部分,检测的主要任务在于从数据集中发掘得到离群对象,而分析是探索检测得到的离群数据背后的内涵知识,包括将离群点进行分类,从而得出有价值的结论或规则。对离群点进行分析往往比分析常规数据更能发现有用的知识,对离群数据进行解释,不仅可以帮助用户评价整体数据的质量,还能使用户对离群数据的产生原因、含义以及行为特征等信息有进一步的认知。这是实际应用中需要重视的问题,同时也是离群挖掘的最终目的。文献[丁天一,张旻,方胜良.一种相似度剪枝的离群点检测算法[J].小型微型计算机系统,2018,39(08):1680-1684.]提出基于相似度剪枝的离群点检测算法,通过构造相似度矩阵,计算样本点之间的相似度,完成对非离群点的剪枝,然后通过LOF算法计算离群候选集中所有点的离群因子。文献[Bowen Zheng,PiervincenzoRizzo,Amir Nasrollahi.Outlier analysis of nonlinear solitary waves for healthmonitoring applications[J].Structural Health Monitoring,2020,19(4).]利用离群点分析的不一致性检验和马氏平方距离,提高基于高度非线性孤立波的监测系统的损伤检测能力,他们从时间波形中提取特征,并输入单变量和多变量分析,将测试数据与一组基线数据进行比较,结果表明,离群点分析显著提高了孤立波检测损伤的能力。张忠平等[张忠平,刘伟雄,张玉停,邓禹,魏棉鑫.ERDOF:基于相对熵权密度离群因子的离群点检测算法[J].通信学报,2021,42(09):133-143.]提出了一种基于相对熵权密度离群因子的离群点检测方法,提高了算法在复杂数据分布和高维度数据集上精度,首先引入熵权距离取代欧氏距离,然后结合自然邻居的概念对数据对象进行高斯核密度估计,同时提出相对距离刻画数据对象偏离邻域的程度,最后使用相对熵权密度离群因子刻画数据对象的离群程度。Knorr和Ng[Knorr E M,Ng R T.Finding intensional knowledge of distance-basedoutliers[C].Proc.of the 25th International Conference on Very Large DataBases.New York:Morgan Kaufmann.1999:211-222.]把基于距离的离群点分为平凡和非平凡两类,根据其不同的特征进一步把非平凡离群点分为强弱两类,他们按照不同属性组合成的子空间自下而上地分析了数据的离群特性。Chen等人[Z Chen,J Tang,A Fu.Modelingand Efficient Mining of Intentional Knowledge of Outliers[C].Proc.of the 7thInternational Database Engineering and Applications Symposium.IEEE ComputerSociety.2003:1-10.]在上个方法的基础上,提出了相关的查找算法,他们认为属性子空间的不同影响着离群点的形成,并将属性空间划分为标识子空间、指示子空间和观测子空间,但这种算法在选择参数时需要有一定的领域知识,对于不同观测点可能导致不同的结果。文献[邓玉洁,朱庆生.基于聚类的离群点分析方法[J].计算机应用研究,2012,29(03):865-868.]引入离群属性和离群簇的概念,提出了基于离群分类进行离群点分析的方法,实现了基于聚类的离群点分类方法,揭示离群点的内涵知识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北水利水电大学,未经华北水利水电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210326548.X/2.html,转载请声明来源钻瓜专利网。