[发明专利]一种基于无量纲特征结合虚拟样本的异常点检测方法有效
申请号: | 202111399279.1 | 申请日: | 2021-11-24 |
公开(公告)号: | CN113822257B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 胡勇;彭六保;曾志生;荆云砚 | 申请(专利权)人: | 航天智控(北京)监测技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京巨弘知识产权代理事务所(普通合伙) 11673 | 代理人: | 赵洋 |
地址: | 100095 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 量纲 特征 结合 虚拟 样本 异常 检测 方法 | ||
本发明提供一种基于无量纲特征结合虚拟样本的异常点检测方法,首先通过提取振动信号的无量纲参数降低不同设备对异常样本的影响,再通过数据标准化消除不同特征之前的尺度影响,然后通过对异常样本的支持向量应用虚拟样本技术获得一定数量的虚拟样本,提高了训练样本数量,利用支持向量机训练模型,提高训练模型的推广能力提高了分类模型的推广能力。本方法利用时域无量纲特征建模,消除不同设备振动数据的尺度影响,利用支持向量的稀疏性进行插值获取足够多虚拟样本,使插值后的样本和原有样本的保持近似一致的概率分布;基于支持向量机建立分类模型,对小样本学习具有很好的泛化性能,提高了异常振动信号识别的鲁棒性,可有效用于实时工业监测。
技术领域
本发明涉及测量测试技术领域,具体涉及一种基于无量纲特征结合虚拟样本的异常点检测方法。
背景技术
异常点挖掘(outlier mining)(通常又称为异常点检测和分析)自从 1980 年被提出以来,经历了几次兴衰交替,近几年,异常点挖掘(outlier mining)再次成为数据挖掘技术领域中具有重要意义的研究方向。异常点就是指海量的数据中的极少量的错误信息,而这极少量的错误信息也可能对社会造成巨大的损失,而异常点挖掘就是指将这一部分极少量的错误信息从海量的信息数据中找出来的方法。随着现实世界的复杂化和多变化,这些复杂异构的数据集中异常点的出现有不同的原因,其中一些异常点可能是因为数据缺失或者错误的输入以及错误的使用测量仪器而造成的,我们把这些异常点叫做错误的数据,这些数据是可以应用某些方式来变换和提出的;其他一些异常点的引起原因可能是数据本身,这些异常点也可能包含一些很有价值的信息,这些异常点往往是数据挖掘中的中心研究内容。因此异常点挖掘的意义已不再局限于早期的消除噪声数据,还在于发现潜在于数据背后的有意义的信息,并对其进行分析和理解。异常点作为蕴藏在海量数据集中的少量数据,已有的数据挖掘方法虽然在分类或模式学习方面表现得很成熟,但在异常点挖掘这个特殊的数据挖掘任务面前还不是很完善,因此,深入探讨异常点挖掘的理论和方法非常必要。异常点检测可以应用到各个的方面,例如气候的变化、基因突变等。异常点挖掘发展至今,出现了许多经典方法,如基于密度的算法、基于聚类的算法、基于距离的算法等。每种算法各有利弊,如基于距离的异常点挖掘是通过 k - 邻域距离来确定是否异常。缺点是对参数的依赖性很强。在基于密度的异常点挖掘中,通过每一个数据点的邻域来判断这个数据是否为异常点。缺点是对序列数据和低密度数据对象不能很好的度量。基于偏差的异常点挖掘是通过对测试数据主要特征的检验来判断是否为异常点。缺点是实际应用比较少。综上可知,针对异常点检测有这么多的经典方法,但是还没有任何一个方法可以完美的解决这个问题, 因此需要对这些方法进行合理的改进。
现有技术中,应用粗糙集原理作为异常点检测能够明确的解释异常数据的挖掘过程;在这种算法中,以分类讨论作为异常点分析的基础,最后给出了异常属性的定义;基于偏差的异常点检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天智控(北京)监测技术有限公司,未经航天智控(北京)监测技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111399279.1/2.html,转载请声明来源钻瓜专利网。