[发明专利]一种支持特征查询的时序数据存储的方法和装置在审
申请号: | 201711322634.9 | 申请日: | 2017-12-12 |
公开(公告)号: | CN108052599A | 公开(公告)日: | 2018-05-18 |
发明(设计)人: | 王建民;黄向东;刘昆;张金瑞;龙明盛;王晨 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 支持 特征 查询 时序 数据 存储 方法 装置 | ||
本发明提供一种支持特征查询的时序数据存储的方法和装置,包括:将待存储的时序数据划分成若干包括多个连续的数据点的数据点集合,通过预设的特征函数计算每个数据点集合的特征值,将每个数据点集合中数据点的时间戳和数据值作为对应数据点集合的原始数据,将特征函数的信息、每个数据点集合的时段信息和特征值作为对应数据点集合的特征数据信息,将一个原始数据块作为一个数据点集合的原始数据的存储空间,对每一数据点集合的原始数据进行存储,将一个特征数据块作为一个数据点集合的特征数据信息的存储空间,对每一数据点集合的特征数据信息进行存储;通过上述存储方法存储的时序数据,既支持对原始的时序数据的查询,又支持对特征值的查询。
技术领域
本发明涉及数据处理技术领域,更具体地,涉及一种支持特征查询的时序数据存储的方法和装置。
背景技术
随着互联网和物联网的快速发展,时间序列数据(简称为时序数据)的采集与使用变得越来越广泛,如:在风力发电行业中,风机上的传感器会不断地产生大量的时序数据,通过对这些数据的实时分析可以对风机状态进行调整,提高风力发电效率;在复杂装备企业中,通过对采集的历史时序数据的统计,可以得到的各个设备的运行状态。
时序数据具有以下的特点:(1)数据量大:一个设备企业往往会有数千甚至上万台设备,每一个台设备上的传感器按照使用的需求以一定时间间隔采集并回传数据,因此,时序数据会不断的快速增加。(2)具有独特的特征:在不同的应用领域,可以针对时序数据采用不同的特征描述,用于强调时序数据的不同特征。例如:可以采用傅里叶变换得到时序数据的频域特征,进而用频域信息作为特征来表征时序数据;采用分段线性近似(PLA)将时序数据分割成多个连续的数据点集合,进而使用多条直线作为特征来表征对应的数据点集合;基本的统计特征(均值,方差,极值等)也可以被视为简单的特征,用于表征时序数据。对于时序数据,使用者可能需要通过原始的时序数据进行查询与分析,也可能只需要某段时间内的数据的一些特征。如:在异常监控中更加关注一段时间内的最大值与最小值。
现有的存储系统在存储时序数据时,一般只对原始的时序数据进行存储,因此目前缺少一种既可以支持对原始的时序数据进行查询,又可以支持对原始的时序数据的特征进行查询的时序数据的存储方法。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明提供一种支持特征查询的时序数据存储的方法和装置。
根据本发明的一个方面,提供一种支持特征查询的时序数据存储的方法,包括:将待存储的时序数据划分成若干数据点集合,每一数据点集合包括多个连续的数据点,每一数据点包括一个时间戳和一个数据值,对于任一数据点集合,将所述任一数据点集合中数据点的时间戳和数据值作为数据点集合的原始数据;将所述任一数据点集合中数据点的最早时间戳和最晚时间戳作为所述任一数据点集合的时段信息,根据预设的特征函数获取所述任一数据点集合的特征值,将所述任一数据点集合的时段信息、特征函数的信息和所述任一数据点集合的特征值作为所述任一数据点集合的特征数据信息;创建原始数据块和特征数据块,将一个原始数据块作为一个数据点集合的原始数据的存储空间,对每一数据点集合的原始数据进行存储,将一个特征数据块作为一个数据点集合的特征数据信息的存储空间,对每一数据点集合的特征数据信息进行存储。
其中,将待存储的时序数据划分成若干数据点集合,包括:按数据点的时间戳的先后顺序,将每预设数量的连续的数据点划分为一个数据点集合。
其中,根据预设的特征函数获取所述任一数据点集合的特征值,包括:调用特征函数,对所述任一数据点集合的原始数据作处理,获取所述任一数据点集合的特征值。
其中,对每一数据点集合的原始数据进行存储,包括:对于所述任一数据点集合,将所述任一数据点集合中每一数据点的时间戳和数据值依次存储在一个原始数据块中,且对于所述任一数据点集合中任一数据点,使所述任一数据点的时间戳关联至所述任一数据点的数据值,以存储所述任一数据点集合的原始数据;依次存储每一数据点集合的原始数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711322634.9/2.html,转载请声明来源钻瓜专利网。