[发明专利]一种基于无量纲特征结合虚拟样本的异常点检测方法有效
申请号: | 202111399279.1 | 申请日: | 2021-11-24 |
公开(公告)号: | CN113822257B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 胡勇;彭六保;曾志生;荆云砚 | 申请(专利权)人: | 航天智控(北京)监测技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京巨弘知识产权代理事务所(普通合伙) 11673 | 代理人: | 赵洋 |
地址: | 100095 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 量纲 特征 结合 虚拟 样本 异常 检测 方法 | ||
1.一种基于无量纲特征结合虚拟样本的异常点检测方法,其特征在于:包括以下步骤:
S1、无量纲特征提取:分别提取正常信号样本集合和异常信号样本集合中每个信号样本的无量纲特征变量,得到正常信号无量纲特征集合和异常信号无量纲特征集合,其中,P为正常信号样本的数量,Q为异常信号样本的数量,L为每个所述信号样本的信号长度,N为正常信号标识,O为异常信号标识;
所述无量纲特征变量的种类包括:时域偏度、时域峭度、时域峰值因子、时域裕度因子、时域波形因子和时域脉冲指数;
时域偏度的计算公式为:;
时域峭度的计算公式为:;
时域峰值因子:;
时域裕度因子的计算公式为:;
时域波形因子的计算公式为:;
时域脉冲指数的计算公式为:;
其中,
S2、数据预处理:对所述正常信号无量纲特征集合和所述异常信号无量纲特征集合中的每个所述无量纲特征变量分别进行尺度归一化,得到正常信号归一化样本集合和异常信号归一化样本集合;
S3、获取支持向量:将所述正常信号归一化样本集合和所述异常信号归一化样本集合使用线性支持向量机建立分类模型并获取支持向量;
S4、获得虚拟样本集:判断所述异常信号归一化样本集合的支持向量在k个近邻中是否稀疏:如果是,则使用内插方法获得虚拟样本,如果否,则使用外插方法获得虚拟样本,虚拟样本形成虚拟样本集合,,其中k为奇数,R为虚拟样本的数量;
S5、训练并建立最终分类模型:将所述正常信号归一化样本集合、所述异常信号归一化样本集合和所述虚拟样本集合使用线性支持向量机建立最终分类模型;
S6、待测样本检测:将待测样本输入所述最终分类模型进行检测,判断是否为异常振动信号。
2.根据权利要求1所述的一种基于无量纲特征结合虚拟样本的异常点检测方法,其特征在于:步骤S2中,尺度归一化的公式为:
;
其中,为无量纲特征变量的均值,为无量纲特征变量的标准差。
3.根据权利要求1所述的一种基于无量纲特征结合虚拟样本的异常点检测方法,其特征在于:步骤S3和步骤S5中,通过SVM算法获取支持向量。
4.根据权利要求3所述的一种基于无量纲特征结合虚拟样本的异常点检测方法,其特征在于:步骤S3中,线性支持向量机的具体使用方法为:
训练样本集为,其中为所述正常信号归一化样本集合或所述异常信号归一化样本集合的样本,是所对应的类别的标记,,i=1,…,n,则将样本正确分开的最优超平面为:
;
则,
其中是松弛变量,。
5.根据权利要求4所述的一种基于无量纲特征结合虚拟样本的异常点检测方法,其特征在于:步骤S5中,为所述正常信号归一化样本集合或所述异常信号归一化样本集合或所述虚拟样本集合中的样本。
6.根据权利要求5所述的一种基于无量纲特征结合虚拟样本的异常点检测方法,其特征在于:
求解最优超平面的方法为:
,
其中C为惩罚因子,C0,是引入的松弛变量;
对偶形式为:
,
其中,α为Lagrange乘子。
7.根据权利要求6所述的一种基于无量纲特征结合虚拟样本的异常点检测方法,其特征在于:
最优分类面为:
,
其中,为Lagrange乘子的最优解,为偏置。
8.根据权利要求6所述的一种基于无量纲特征结合虚拟样本的异常点检测方法,其特征在于:惩罚因子C通过训练集5折交叉验证自动获取。
9.根据权利要求1所述的一种基于无量纲特征结合虚拟样本的异常点检测方法,其特征在于:步骤S4中,k为5。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天智控(北京)监测技术有限公司,未经航天智控(北京)监测技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111399279.1/1.html,转载请声明来源钻瓜专利网。