[发明专利]一种面向多源大数据流的分布式索引方法有效
申请号: | 201810630231.9 | 申请日: | 2018-06-19 |
公开(公告)号: | CN108920552B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 杨良怀;卢晨曦;范玉雷 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 周红芳 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向多源大数据流的分布式索引方法,可实现数据流高效存储、索引快速构建,并提供高并发的近实时查询服务。针对多源大数据流特点,本发明提出了三层的分布式索引结构:最底层是基于数据流元组的索引,中间层是基于数据流时间窗口的索引,顶层是基于数据源的索引。由于单个计算节点的资源和处理能力有限,无法有效应对潜在规模无限和实时到达的数据流应用场景,本发明设计出主从结构和P2P结构相结合的集群架构。集群中主要由索引构建节点,查询节点,查询分发节点,存储节点,主控节点这五种节点组成,同时考虑集群中的数据存储、负载均衡、可扩展性因素,使得各个节点相互协作,稳定运转,从而提供高效的服务。 | ||
搜索关键词: | 一种 面向 多源大 数据流 分布式 索引 方法 | ||
【主权项】:
1.一种面向多源大数据流的分布式索引方法,采用三层的分布式索引结构,实现多源大数据流高效存储、快速构建索引,并提供高并发的近实时查询服务,其特征在于具体为采用主从结构和P2P结构相结合的分布式集群架构,并通过将分布式集群架构中不同类型节点的有机组合,实现数据流元组存储、索引构建与维护,并提供高并发的近实时查询服务;所述分布式集群架构包括:主控节点,负责监控集群整体情况,协调集群中的所有节点;索引构建节点,负责接收数据流以及索引的构建和发布工作;存储节点,负责数据流元组的最终存储;查询节点,负责索引的维护以及响应查询请求;查询分发节点,负责分发查询请求,控制查询请求的负载均衡。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810630231.9/,转载请声明来源钻瓜专利网。