[发明专利]一种时序数据流分割方法、装置及其存储介质在审
申请号: | 201910784191.8 | 申请日: | 2019-08-23 |
公开(公告)号: | CN112416971A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 甘建明 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 郑红娟;宋志强 |
地址: | 100083 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时序 数据流 分割 方法 装置 及其 存储 介质 | ||
本发明公开了一种时序数据流分割方法、装置及其存储介质,该方法包括:接收时序数据流,其中,所述时序数据流中的时序数据具有对应的时序值和数据值;根据所有所述时序数据的时序值选取第一时序数据和第二时序数据,根据所述第一时序数据和所述第二时序数据构建关于时间值和数据值的关系函数;根据所述关系函数和所述时序数据计算得到所述关系函数的精度;根据所述精度对所述时序数据流进行分割;本申请通过时序数据本身的数值自适应的提供了一个用于计算精度,不需要人为再不断的调节预定阈值,以使有关时间的时序数据处理时,不再需要人为干预,提高了时序数据的处理效率。
技术领域
本发明涉及计算机领域,尤其是指一种时序数据流分割方法、装置及其存储介质。
背景技术
目前,时序数据的处理方法被广泛的应用于各个领域之中。尤其在电商、金融、科学和工程领域需要处理大量的此类时序数据。比如在电商领域,每秒都有成千上万的订单记录和物流记录。在金融领域中,每秒都有很大量的动态电子交易记录。对于上述的时序数据需要人们根据时间上的规律对其进行处理。现有技术中的处理方法需要进行人为不断的干预才能实现。
所以发明人发现现有技术中至少存在如下问题,对于有关时间的时序数据处理由于需要人为干预,经常出现处理效率低下的技术问题。
发明内容
本申请提供了一种时序数据流分割方法,该方法包括:
接收时序数据流,其中,所述时序数据流中的时序数据具有对应的时序值和数据值;
根据所有所述时序数据的时序值选取第一时序数据和第二时序数据,其中,所述第一时序数据为所有所述时序数据中时序值最小的时序数据,所述第二时序数据为所有所述时序数据中时序值最大的时序数据;
根据所述第一时序数据和所述第二时序数据构建关于时间值和数据值的关系函数;
根据所述时序数据的时间值经过所述关系函数计算得到对应的函数数据值;
将所述函数数据值与对应所述时序数据的数据值按预定方式进行比对计算得到所述关系函数的精度,其中,所述精度描述所述函数数据值与对应时序数据数据值的相似度;
根据所述精度对所述时序数据流进行分割。
可选地,所述根据所述精度对所述时序数据流进行分割包括:
如果所述精度符合预定阈值,则将所有所述时序数据归为时序数据流的同一段时序数据,如果所述精度不符合预定阈值,则选取所述时序数据中的分割时序数据,其中,所述分割时序数据为所述时序数据中数据值和函数数据值差值最大的时序数据,将所述时序数据流中所述时序数据时间值与所述分割时序数据的时间值的数值大小进行对比,将大于所述分割时序数据时间值的时序数据分割为所述时序数据流的一段时序数据,小于所述分割时序数据时间值的时序数据分割为所述时序数据流的另一段时序数据,对两段时序数据分别重复执行上述选取时序数据和构建关系函数,以及计算精度和时序数据流分割的步骤,直到分割的每一段时序数据构建的关系函数精度均符合预定阈值。
可选地,所述根据所述精度对所述时序数据流进行分割步骤后,该方法还包括:
对每段时序数据的所述关系函数进行线性回归,得到交叉点;
连接所述交叉点得到每段时序数据的拟合结果。
可选地,所述根据所述精度对所述时序数据流进行分割步骤后,该方法还包括:
接收所述时序数据流后续的时序数据;
根据后续的时序数据与其前一段所述关系函数的精度计算,得到更新精度;
根据更新精度重新分割时序数据的分段,具体步骤如下:
如果更新精度符合预定阈值,则将后续的时序数据归入前一段时序数据流,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司,未经北京沃东天骏信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910784191.8/2.html,转载请声明来源钻瓜专利网。