[发明专利]一种大数据流查询的方法及设备有效

专利信息
申请号: 201710409011.9 申请日: 2017-06-02
公开(公告)号: CN107368517B 公开(公告)日: 2018-07-13
发明(设计)人: 徐广庆;肖俊 申请(专利权)人: 上海恺英网络科技有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海百一领御专利代理事务所(普通合伙) 31243 代理人: 陈贞健;姜伯炎
地址: 200232 上海市徐*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请的目的是提供一种大数据流查询的方法及设备,本申请通过对所采集的实时数据流进行动态数据模式的识别,以更新元数据信息,通过结构化查询语句(sql)在窗口和全量数据上分别执行,得到的结果进行合并,将实时变化的结果保存数据结果缓存中,结果随着实时数据流的变化而发生变化,实现利用sql的方式查询动态数据,对数据类型动态识别,达到用户像使用传统数据库一样,不再需要专门的开发工作。进一步地,数据类型动态生成元数据信息,支持灵活的元数据定义方式,采用窗口预聚合技术提前压缩合并实时数据,对实时数据采用sql方式查询的全量数据聚合,提供了一种sql查询实时数据的方法,灵活的结果生命周期管理方式,存储结果更加高效。
搜索关键词: 实时数据 实时数据流 大数据流 动态数据 方式查询 全量数据 数据类型 灵活的 结构化查询语句 缓存 生命周期管理 传统数据库 更新元数据 元数据信息 查询 存储结果 定义方式 动态生成 动态识别 结果保存 实时变化 数据结果 合并 用户像 预聚合 元数据 申请 聚合 采集 压缩 开发
【主权项】:
1.一种大数据流查询的方法,其中,所述方法包括:采集数据流,其中,数据流包括用户指定的数据源及待查询的结构化查询语句;通过分布式队列接收所述数据源的原始数据,通过键值自解析方式对所述接收的原始数据进行反序列化,识别所述原始数据的内部键值字段;获取元数据库中存在的所述原始数据的元数据信息,通过键进行匹配检查所述元数据信息是否包含所述键值的定义,若否,则根据所述数据流的数据类型对所述元数据信息进行实时解析,将解析结果更新至所述元数据库,并更新所述待查询的结构化查询语句的查询信息;根据更新后的待查询的结构化查询语句的查询信息及更新后的元数据信息进行所述数据流的窗口数据聚合,得到全聚合数据队列中的数据;从所述全聚合数据队列获取待全聚合数据,对所述待全聚合数据进行全量数据聚合,得到全量数据聚合的数据结果;将所述全量数据聚合的数据结果进行缓存,实时显示查询结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海恺英网络科技有限公司,未经上海恺英网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710409011.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top