[发明专利]一种基于相似工况的时间序列压缩存储方法及系统在审
申请号: | 201711320722.5 | 申请日: | 2017-12-12 |
公开(公告)号: | CN108062376A | 公开(公告)日: | 2018-05-22 |
发明(设计)人: | 王建民;黄向东;江天;龙明盛;王晨 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 相似 工况 时间 序列 压缩 存储 方法 系统 | ||
1.一种基于相似工况的时间序列压缩存储方法,其特征在于,包括:
步骤S1、将时间序列按照时序划分为多个数据窗口,每个数据窗口包括预设数量个数据点,所述数据窗口包括未存储的第一数据窗口和已存储的第二数据窗口集合;
步骤S2、基于预设的特征函数,计算所述第一数据窗口的特征值;
步骤S3、基于所述第一数据窗口的特征值,在所述第二数据窗口集合中,确定与所述第一数据窗口特征距离最小且所述特征距离小于预设阈值的第二数据窗口;
步骤S4、基于所述第二数据窗口,对所述第一数据窗口中的每个数据点进行差值压缩存储。
2.根据权利要求1所述的方法,其特征在于,步骤S2后所述方法还包括:
若所述第二数据窗口集合中所有数据窗口与所述第一数据窗口的特征距离均大于预设阈值,则直接存储所述第一数据窗口。
3.根据权利要求1所述的方法,其特征在于,步骤S2具体包括:
基于预设的平均值函数,计算所述第一数据窗口中每个数据点平均值标量;
将所述平均值标量作为所述第一数据窗的特征值。
4.根据权利要求1所述的方法,其特征在于,步骤S3包括:
S31、基于预设的采样函数,在所述第二数据窗口集合中采样出目标数据窗口;
S32、基于目标数据窗口的特征值和所述第一数据窗口的特征值,计算每个采样出的目标数据窗口和所述第一数据窗口之间的特征距离;
S33、将特征距离最小且特征距离小于预设阈值的目标数据窗口,作为所述第二数据窗口。
5.根据权利要求4所述的方法,其特征在于,步骤S31具体包括:
基于预设的随机抽样函数,在所述第二数据窗口集合中进行随机抽样,抽样次数小于等于第二数据窗口集合中包含的数据窗口的个数;
将每次随机抽样出的数据窗口作为所述目标数据窗口。
6.根据权利要求4所述的方法,其特征在于,步骤S32具体包括:
采用与所述第一数据窗口同样的特征值计算函数,计算每个所述目标数据窗口的特征值;
基于每个所述目标数据窗口的特征值和所述第一数据窗口的特征值,计算每个所述目标数据窗口与所述第一数据窗口之间的欧式距离。
7.根据权利要求1所述的方法,其特征在于,步骤S4包括:
将所述第一数据窗口中的每个数据点与所述第二数据窗口中的每个数据点逐点作差,得到差值序列;
对所述差值序列直接压缩后存储。
8.一种基于相似工况的时间序列压缩存储系统,其特征在于,包括:
窗口划分模块,用于将时间序列按照时序划分为多个数据窗口,每个数据窗口包括预设数量个数据点,所述数据窗口包括未存储的第一数据窗口和已存储的第二数据窗口集合;
特征值计算模块,用于基于预设的特征函数,计算所述第一数据窗口的特征值;
特征距离比较模块,用于基于所述第一数据窗口的特征值,在所述第二数据窗口集合中,确定与所述第一数据窗口特征距离最小且所述特征距离小于预设阈值的第二数据窗口;
压缩存储模块,用于基于所述第二数据窗口,对所述第一数据窗口中的每个数据点进行差值压缩存储。
9.一种计算机程序产品,其特征在于,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行如权利要求1至7任一所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至7任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711320722.5/1.html,转载请声明来源钻瓜专利网。