[发明专利]一种大数据在线交互式查询方法及系统在审
申请号: | 201510272521.7 | 申请日: | 2015-05-25 |
公开(公告)号: | CN104951509A | 公开(公告)日: | 2015-09-30 |
发明(设计)人: | 云晓春;王树鹏;吴广君;张晓宇;贾思宇 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 余功勋 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 在线 交互式 查询 方法 系统 | ||
1.一种大数据在线交互式查询方法,其步骤包括:
1)用户根据业务需求定义与业务相关的计算窗口划分方法;
2)根据所述计算窗口划分方法建立计算窗口与HDFS中存储的数据文件映射关系;
3)修改Map Reduce框架下数据获取方式,由Reduce端实时返回每个计算窗口内的计算结果,以实现大数据环境下数据的在线交互式查询。
2.如权利要求1所述的大数据在线交互式查询方法,其特征在于,所述计算窗口划分方法包括按照时间属性划分的方法,按照相同记录数为单位进行划分的方法,或按照其他关键字为标识划分的方法。
3.如权利要求1所述的大数据在线交互式查询方法,其特征在于,建立计算窗口与HDFS中存储的数据文件映射关系包括:根据计算窗口划分方法,顺序扫描存储于HDFS中的数据,得到每一个窗口中对应的数据,同时计算每一个窗口包含数据大小的偏移量,根据计算所得的结果生成计算窗口映射表。
4.如权利要求3所述的大数据在线交互式查询方法,其特征在于,所述计算窗口映射表的数据结构为Hash表结构,其中Key值为窗口编号,Value值为该窗口包含数据大小偏移量,通过该结构,表明了每个窗口与该窗口包含数据大小偏移量的对应关系。
5.如权利要求1所述的大数据在线交互式查询方法,其特征在于,修改Map Reduce框架下数据获取方式,使得Reduce端实时返回每个计算窗口内的计算结果,包括:将待处理数据按照所述计算窗口映射表进行分片,每个数据片交付一个Map进行操作,每一个Map在执行完其所有操作后,在Job Tracker的调度下,推向Reduce端,Reduce立即对这一部分数据进行处理并返回结果。
6.如权利要求5所述的大数据在线交互式查询方法,其特征在于,分片的方法包括:首先获得HDFS中待处理数据的总大小,读取计算窗口映射表,每读取一条数据的同时,计算该条数据的偏移量大小,并将该偏移量大小累加,当读入数据的偏移量大小与窗口映射表中的数据偏移量一致的时候,作为一个数据片。
7.如权利要求5所述的大数据在线交互式查询方法,其特征在于,Job Tracker为每个Map分配任务,每个Map执行一个数据片的数据,将执行完的数据缓存至内存中设定好的一个缓存区,TaskTracker计算轮询的时间周期,按照时间周期查询该缓存区是否有Map提交的处理后的数据,若缓存区数据大小达到阈值,则Reduce将这部分数据取走并处理,并将处理的结果立即返回。
8.一种大数据在线交互式查询系统,包括:
计算窗口划分单元:用于提供用户计算窗口定义功能;
映射表构建单元:用于把用户定义的计算窗口转化为MapReduce框架可识别的“文件名+数据偏移量”的表达形式的计算窗口映射表;
分片计算单元,用于根据计算窗口映射表读取HDFS中的文件分块,每个窗口作为一个分片数据,读入Map端,开始执行Map和Reduce函数计算过程;
数据处理单元,用于在Map端读入每个数据分片进行处理,并将Map端处理后的数据利用推模式,实施推送到Reduce端开始执行,在Reduce端执行完Reduce函数以后,立即返回计算结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510272521.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种负面舆情指数的计算方法及系统
- 下一篇:获取多媒体文件的方法和装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置