[发明专利]基于邻域样本特征对比学习的时序数据异常点监测方法在审
申请号: | 202210570215.1 | 申请日: | 2022-05-24 |
公开(公告)号: | CN114970712A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 郝晨先;牛彦峰;王国忠;贾皓杰;张敏;宋彩娜;刘文琴;张斌波;温浩;沙晓鹏 | 申请(专利权)人: | 山西省交通建设工程质量检测中心(有限公司) |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京太兆天元知识产权代理有限责任公司 11108 | 代理人: | 易卫 |
地址: | 030032 山西省太*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 邻域 样本 特征 对比 学习 时序 数据 异常 监测 方法 | ||
本发明提供一种基于邻域样本特征对比学习的时序数据异常点监测方法,基于输入样本建立样本的特征组合,通过初始化查询表学习输入样本的线性特征;利用输入样本的近邻区域相似样本,计算正样本,学习正样本的线性特征,在非近邻区域的不相似样本集中采样负样本,学习负样本的线性特征;根据输入样本的非线性特征预测类别标签,通过对比学习最小化输入样本与正样本之间的线性特征距离,最大化输入样本与负样本之间的线性特征距离;基于学习的参数预测新样本的类别标签分类概率,标注是否为异常样本。本发明从样本的近邻区域相似样本特征识别样本是否异常,在桥梁结构健康监测时序数据异常识别方面具有重要应用价值。
技术领域
本发明涉及时序数据异常识别技术领域,尤其涉及一种基于邻域样本特征对比学习的时序数据异常点监测方法。
背景技术
目前的桥梁结构健康监测工作中,传感器采集的时序数据维度较少,且伴有缺失、噪声和异常等特点。桥梁结构健康监测传感器数据异常识别任务中,需要的人工标注成本较高。针对时序数据进行样本的特征学习,并实现基于机器学习的异常数据识别,对于提升桥梁结构的安全诊断具有重要的意义。
桥梁结构健康监测时序数据中,样本点的离差、近邻等信息可以丰富样本的初始特征。样本点的异常监测需要考虑到相似样本的类别信息,基于相似样本的特征来增强样本点的特征,有助于提升样本异常识别的精准性。
发明内容
为解决现有技术存在的局限和缺陷,本发明提供一种基于邻域样本特征对比学习的时序数据异常点监测方法,包括:
步骤S1,对输入的样本进行特征组合;
步骤S2,学习样本x的非线性特征;
所述步骤S2包括:获取样本x,根据多层感知器学习所述样本x的非线性特征hx=tanh(w1x');
步骤S3,获取正样本x+的嵌入表示线性特征;
步骤S4,获取负样本x-的嵌入表示线性特征;
步骤S5,学习所述正样本x+与所述负样本x-对比中的特征参数;
步骤S6,计算新样本s的类别标签分类概率
步骤S7,根据所述类别标签分类概率标注所述新样本s是否为异常样本;
步骤S8,若所述类别标签分类概率大于或等于0.5,标注所述新样本s为正常样本;若所述类别标签分类概率小于0.5,标注所述新样本s为异常样本。
可选的,所述步骤S1包括:
设定样本特征x;
对所述样本特征x进行[0,1]区间归一化;
归一化后的样本特征为
根据所述样本特征x与均值μ计算离差|x-μ|;
将作为样本x的输入特征。
可选的,所述步骤S3包括:
初始化向量查询表w2,随机初始化每个样本的向量表示,其中w2为可学习的参数矩阵;
对所述样本x的δ邻域窗口区间[x-δ,x+δ]内的相似样本x1,x2,...,xn的样本特征x′1,x'2,...,x'n进行求和平均,生成正样本x+,其中δ=0.001;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西省交通建设工程质量检测中心(有限公司),未经山西省交通建设工程质量检测中心(有限公司)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210570215.1/2.html,转载请声明来源钻瓜专利网。