[发明专利]一种海量时间序列的分布式索引方法在审
申请号: | 201810090501.1 | 申请日: | 2018-01-30 |
公开(公告)号: | CN108319678A | 公开(公告)日: | 2018-07-24 |
发明(设计)人: | 郭棋林;周向东;庞悦;曹满亮;陈海波;郭乃网;苏运;田英杰;张勇;凌平 | 申请(专利权)人: | 复旦大学;国网上海市电力公司;华东电力试验研究院有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵志远 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 时间序列 索引树 分布式索引 构建 索引 索引树结构 运行效率 存储 查询 | ||
1.一种海量时间序列的分布式索引方法,其特征在于,包括以下步骤:
1)iSAX编码:获取全部原始待索引的时间序列,并对每个时间序列进行iSAX编码,获取对应的iSAX字表示,作为索引树中的每个时间序列对应的路径;
2)构建索引树:将每个时间序列的iSAX字表示作为索引树中的每个时间序列对应的路径,并根据每个时间序列对应的路径进行索引树结构的构建,对建好的索引树进行存储和查询。
2.根据权利要求1所述的一种海量时间序列的分布式索引方法,其特征在于,所述的步骤1)中,在对每个时间序列进行iSAX编码时,采用二进制的方式进行编码。
3.根据权利要求1所述的一种海量时间序列的分布式索引方法,其特征在于,所述的步骤2)中,所述的索引树结构包括根节点、中间节点和叶子节点。
4.根据权利要求3所述的一种海量时间序列的分布式索引方法,其特征在于,所述的步骤2)具体包括以下步骤:
21)对所有时间序列的路径进行展开,并对每个节点包含的时间序列数量进行计数;
22)设定阈值,依次根据每个节点的计数值与阈值的关系进行节点的分裂,最终形成索引树的结构。
5.根据权利要求4所述的一种海量时间序列的分布式索引方法,其特征在于,所述的步骤22)中,若节点的计数值大于阈值,则将其作为中间节点,并进行二分裂,若节点的计数值小于阈值,则将其作为叶子节点。
6.根据权利要求5所述的一种海量时间序列的分布式索引方法,其特征在于,所述的步骤22)中,若二分裂后的叶子节点的计数值仍然大于阈值时,则继续二分裂形成新的叶子节点。
7.根据权利要求1所述的一种海量时间序列的分布式索引方法,其特征在于,所述的步骤1)中,在每个时间序列进行iSAX编码前,采用PAA变换对原始待索引的时间序列进行降维。
8.根据权利要求5所述的一种海量时间序列的分布式索引方法,其特征在于,所述的步骤22)中,阈值设置为300。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学;国网上海市电力公司;华东电力试验研究院有限公司,未经复旦大学;国网上海市电力公司;华东电力试验研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810090501.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:动态变化的网络关系图的对齐方法
- 下一篇:一种主键的生成方法及装置