[发明专利]基于MapReduce实现分析函数的方法及系统有效
申请号: | 201210580817.1 | 申请日: | 2012-12-27 |
公开(公告)号: | CN103902592B | 公开(公告)日: | 2018-02-27 |
发明(设计)人: | 张书彬;田万鹏;肖品;鲍春健;郭玮 | 申请(专利权)人: | 深圳市腾讯计算机系统有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙)44285 | 代理人: | 王仲凯 |
地址: | 510075 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于MapReduce实现分析函数的方法及系统,涉及数据库领域,用于解决现有技术中基于MapReduce框架的分布式数据仓库无法使用分析函数进行数据进行分析处理的问题。本发明提供的处理数据的方法包括表扫描算子从文件块获取数据行,将所述数据行发送至映射算子;所述映射算子接收所述数据行,确定分析函数的归约键、分割键和排序键,通过MapReduce框架将所述数据行发送至分析算子;所述分析算子接收所述数据行,对所述数据行进行分析得到分析结果,并将所述数据行和分析结果转发至后继算子。本发明适用于基于MapReduce框架的数据仓库领域,用于实现分析函数。 | ||
搜索关键词: | 基于 mapreduce 实现 分析 函数 方法 系统 | ||
【主权项】:
一种基于MapReduce实现分析函数的方法,其特征在于,包括:表扫描算子从文件块获取数据行,将所述数据行发送至映射算子;所述映射算子接收所述数据行,确定分析函数的归约键、分割键和排序键,通过MapReduce框架将所述数据行发送至分析算子,所述分析算子属于所述MapReduce框架的Reduce端;所述分析算子接收所述数据行,将所述数据行存储于分析算子缓冲区;所述分析算子解析出所述数据行的分区字段;若根据所述分区字段确定所述数据行属于当前分区,则调用分析函数对应的分析器对所述数据行进行分析,得到分析结果,将所述分析结果存储于分析器缓冲区;若根据所述分区字段确定所述数据行不属于当前分区,则结束对所述当前分区的分析,将所述分析算子缓冲区中存储的当前分区的所有数据行、以及所述分析器缓冲区中存储的当前分区的所有分析结果汇总成新的数据行转发至后继算子;其中所述当前分区是所述分析算子接收到的上一数据行所属的分区。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市腾讯计算机系统有限公司,未经深圳市腾讯计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210580817.1/,转载请声明来源钻瓜专利网。