[发明专利]一种用于时序数据降采样的方法和系统有效
申请号: | 202011579516.8 | 申请日: | 2020-12-28 |
公开(公告)号: | CN112699165B | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | 王立峰;自明;任成宾;郭英端;赵金栋;潘爱兵;于庆海 | 申请(专利权)人: | 山东鲁能软件技术有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/215;G06F16/248 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 李舜江 |
地址: | 250001 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 时序 数据 采样 方法 系统 | ||
本发明涉及一种用于时序数据降采样的方法和系统,所述的方法包括:S1:定义TimeGap辅助算法,S2:定义Mixed辅助算法,S3:对于给定的待降采样数据data、阈值t,使用Mixed(LTTB(data,t),TimeGap(data,t/10))进行计算,得到所需要的降采样结果数据。
技术领域
本发明属于计算机软件技术领域,具体涉及一种用于时序数据降采样的方法和系统。
背景技术
时序数据是指时间序列数据。时间序列数据是同一指标按时间顺序记录的数据列,例如设备监测传感器产生的数据、IT系统监控数据等。时序数据的可视化最常用的手段就是折线图,而时序数据往往数据量较大,采用折线图展示其趋势的时候,数据过多会严重降低绘图程序的性能,另外受到用户显示设备像素多少的约束,过多的数据可能会呈现为一片密集的色块,无法分辨细节,实际上没有意义。所以需要对时序数据进行降采样,从大量数据中提取出最具有特征的样本,用来绘制折线图。
目前最广泛应用的时序数据降采样方法是由冰岛大学的Sveinn在2013年提出的LTTB(Largest-Triangle-Three-Buckets)、LTD(Largest-Triangle-Dynamic)等方法。在传统实时数据库领域,OSIsoft的PI System应用广泛,PI系统的趋势函数所采用的降采样方法是一种特殊的方法。
在实际使用过程中,我们发现现有的时序数据降采样方法存在以下问题:
基于最大三角形的LTTB、LTD方法能较好的反应数据的特征,但是在特殊情况下准确性不够,导致趋势图出现“斜坡效应”;
“斜坡效应”指在时序数据在出现比正常时间间隔相比明显增大的时间间隔时,经过降采样方法降采样后丢失关键数据,导致本来的“尖峰”、“悬崖”形状的图形变成一个“斜坡”。LTTB:是英文Largest-Triangle-Three-Buckets的缩写,是Sveinn于2013年在其论文中描述的时序数据降采样方法。其特点在于使用相邻点构成的三角形面积作为权重筛选出特征点。
LTD:是英文Largest-Triangle-Dynamic的缩写,是Sveinn于2013年在其论文中描述的时序数据降采样方法。其特点在于通过动态调整桶的大小,优化了LTTB在数据不均匀分布的情况下的表现,能更好的反应密集波动数据的细节。
PI系统:OSIsoft公司的实时数据库产品,广泛应用于生产行业的实时数据存储和展示。
PI趋势图的降采样方法不会产生“斜坡效应”,但是在反应趋势特征上不如最大三角形算法,并且采样数量远大于给定的阈值(约为给定阈值的3-4倍),可能引发绘图程序的性能问题。此为现有技术的不足之处。
有鉴于此,本发明提供一种用于时序数据降采样的方法和系统,以解决现有技术中存在的上述缺陷,是非常有必要的。
发明内容
本发明的目的在于,针对上述现有技术存在的缺陷,提供设计一种用于时序数据降采样的方法和系统,以解决上述技术问题。
为实现上述目的,本发明给出以下技术方案:
一种用于时序数据降采样的方法,包括以下步骤:
S1:定义TimeGap辅助算法,该算法步骤如下:
S11:对待降采样的数据中除最后一个数据点以外的每个数据点,计算△t=t1-t0,作为本数据点的权重,最后一个数据点的权重设为0,其中t0为当前数据点的时间,t1为其右侧数据点的时间;
S12:按照权重由大到小的顺序,选取数据点及其右侧数据点作为已选数据点,直至已选数据点的数量大于或等于规定的阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东鲁能软件技术有限公司,未经山东鲁能软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011579516.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置