[发明专利]基于邻域样本特征对比学习的时序数据异常点监测方法在审
申请号: | 202210570215.1 | 申请日: | 2022-05-24 |
公开(公告)号: | CN114970712A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 郝晨先;牛彦峰;王国忠;贾皓杰;张敏;宋彩娜;刘文琴;张斌波;温浩;沙晓鹏 | 申请(专利权)人: | 山西省交通建设工程质量检测中心(有限公司) |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京太兆天元知识产权代理有限责任公司 11108 | 代理人: | 易卫 |
地址: | 030032 山西省太*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 邻域 样本 特征 对比 学习 时序 数据 异常 监测 方法 | ||
1.一种基于邻域样本特征对比学习的时序数据异常点监测方法,其特征在于,包括:
步骤S1,对输入的样本进行特征组合;
步骤S2,学习样本x的非线性特征;
所述步骤S2包括:获取样本x,根据多层感知器学习所述样本x的非线性特征hx=tanh(w1x');
步骤S3,获取正样本x+的嵌入表示线性特征;
步骤S4,获取负样本x-的嵌入表示线性特征;
步骤S5,学习所述正样本x+与所述负样本x-对比中的特征参数;
步骤S6,计算新样本s的类别标签分类概率
步骤S7,根据所述类别标签分类概率标注所述新样本s是否为异常样本;
步骤S8,若所述类别标签分类概率大于或等于0.5,标注所述新样本s为正常样本;若所述类别标签分类概率小于0.5,标注所述新样本s为异常样本。
2.根据权利要求1所述的基于邻域样本特征对比学习的时序数据异常点监测方法,其特征在于,所述步骤S1包括:
设定样本特征x;
对所述样本特征x进行[0,1]区间归一化;
归一化后的样本特征为
根据所述样本特征x与均值μ计算离差|x-μ|;
将作为样本x的输入特征。
3.根据权利要求2所述的基于邻域样本特征对比学习的时序数据异常点监测方法,其特征在于,所述步骤S3包括:
初始化向量查询表w2,随机初始化每个样本的向量表示,其中w2为可学习的参数矩阵;
对所述样本x的δ邻域窗口区间[x-δ,x+δ]内的相似样本x1,x2,...,xn的样本特征x'1,x'2,...,x'n进行求和平均,生成正样本x+,其中δ=0.001;
对于正样本x+,根据所述向量查询表w2,获取所述正样本x+的嵌入表示线性特征
4.根据权利要求3所述的基于邻域样本特征对比学习的时序数据异常点监测方法,其特征在于,所述步骤S4包括:
根据负样本集Nb进行采样获得负样本x-,所述负样本集Nb不在所述δ邻域窗口区间[x-δ,x+δ]内;
根据初始化后的向量查询表w2,获取所述负样本x-的嵌入表示线性特征
5.根据权利要求4所述的基于邻域样本特征对比学习的时序数据异常点监测方法,其特征在于,所述步骤S5包括:
根据初始化后的向量查询表w2,获取所述样本x的嵌入表示线性特征vx,将所述样本x的嵌入表示线性特征vx与所述样本x的非线性特征hx拼接成为特征vx′;
基于预测样本的类别标签,通过损失函数优化权重参数q和权重参数b;
通过损失函数最小化所述样本x与所述正样本x+之间的特征距离,而且最大化所述样本x与所述负样本x-之间的特征距离,其中f函数为余弦相似度函数;
通过多任务联合损失函数L1+L2,学习特征参数。
6.根据权利要求5所述的基于邻域样本特征对比学习的时序数据异常点监测方法,其特征在于,所述步骤S6包括:
对于新样本s,根据学习到的权重参数w1、权重参数q和权重参数w2,基于计算所述新样本s的类别标签分类概率
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西省交通建设工程质量检测中心(有限公司),未经山西省交通建设工程质量检测中心(有限公司)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210570215.1/1.html,转载请声明来源钻瓜专利网。