[发明专利]数据查询方法及装置有效
申请号: | 201210477543.3 | 申请日: | 2012-11-21 |
公开(公告)号: | CN103838632A | 公开(公告)日: | 2014-06-04 |
发明(设计)人: | 王永伟;赵黎明;孙伟光 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 吴贵明;张永明 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 查询 方法 装置 | ||
技术领域
本申请涉及数据处理领域,具体而言,涉及一种数据查询方法及装置。
背景技术
在现有技术中,用户提交计算请求至数据仓库计算平台,提交至数据仓库平台的类SQL语句会转换为映射化简命令来执行,执行过程中,映射化简命令会为映射计算和化简计算分配计算资源,其中,数据仓库估算化简任务数(即任务预计需要的资源的数量)以便为化简计算分配计算资源的方法如下:
(1)判断任务是否需要进行化简操作,如不需要化简操作,将化简任务数设置为0,然后跳出;如需要进行化简操作则执行步骤(2);
(2)判断是否在编译时确定化简的任务数为1(即化简任务数,也即化简任务的数量),如果在编译时确定化简任务数为1,则将化简任务数设置为1,然后跳出;如果不是在编译时确定化简任务数为1,则执行步骤(3),其中,
(3)判断任务是否已经手动设置化简任务数,如果已经手动设置化简任务数,则将化简任务数设置为此手动设置的值,跳出;如果没有手动设置化简任务数,则执行步骤(4);
(4)根据映射的输入大小(即map_input_bytes,映射任务时所输入的输入值)估算化简任务数,默认为将映射的输入的1G Bytes估算为1个化简任务数,根据映射的输入大小估算的化简任务数设置此任务的化简任务数。
对于上述数据仓库估算化简任务数方法的步骤(4),数据仓库计算平台根据映射的输入大小估算映射化简任务的化简任务数,这种方法估算出的化简任务数不准确,导致任务运行缓慢或者资源浪费,为了解决此问题,现有技术中的化简任务数自动优化系统可以对数据仓库计算平台估算的化简任务数进行自动优化。
图1是根据本申请现有技术的化简优化方法的流程图。如图1所示,该方法包括如下步骤:
步骤A:根据HQL语句进行计算,以获取HQL的指纹信息;
步骤B:对HQL语句进行解析,获取任务数据集;
步骤C:根据指纹信息获取任务历史日志数据,估算并设置任务数据集中的化简任务数,以获取处理后的任务;
步骤D:提交并执行处理后的任务数据集中的映射化简任务;
步骤E:解析映射化简任务的执行日志并将执行日志保存在数据库中。
由上述数据仓库计算平台估算化简任务数的方法可知,上述方法步骤C中,对于化简任务数不为1的映射化简任务的化简任务数重新估算并设置,而对于数据仓库计算平台估算的化简任务数为1的映射化简任务不进行重新估算和设置,这样化简自动优化系统对化简任务数优化的结果就不准确,从而使得系统分配给执行该任务的资源不准确,从而导致任务的处理速度缓慢。
针对现有技术中由于系统在处理任务时分配任务资源不准确,导致任务的处理速度缓慢且浪费资源的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术由于数据仓库计算平台在处理任务时估算化简任务数不准确,导致任务的处理速度缓慢且浪费资源的问题,目前尚未提出有效的解决方案,为此,本申请的主要目的在于提供一种数据查询方法及装置,以解决上述问题。
为了实现上述目的,本申请提供了一种数据查询方法,包括:获取查询请求,其中,查询请求包括任务的标识以及任务预计需要的资源的数量N;判断任务预计所需要的资源的数量N是否根据映射任务所输入的输入值确定;在任务预计所需要的资源的数量N是根据映射任务所输入的输入值确定的情况下,对任务预计所需的资源的个数N进行更新得到当前为任务分配的资源的数量M;使用M个为任务分配的资源执行任务,以得到与查询请求对应的查询结果。
进一步地,在判断任务预计所需要的资源的数量N是否根据映射任务所输入的输入值确定之后,方法还包括:在任务预计所需要的资源的数量N不是根据映射任务所输入的输入值确定的情况下,为任务分配N个资源,并使用N个为任务分配的资源执行任务,以得到与查询请求对应的查询结果。
进一步地,判断任务预计所需要的资源的数量N是否根据映射任务所输入的输入值确定的步骤包括:获取任务的标识;检测任务的标识中是否设置有标签,其中,标签用于指示任务预计所需要的资源的数量N是否根据映射任务所输入的输入值确定的;在任务的标识中设置有标签的情况下,得到任务预计所需要的资源的数量N不是根据映射任务所输入的输入值确定的判断结果;在任务的标识中没有设置标签的情况下,得到任务预计所需要的资源的数量N是根据映射任务所输入的输入值确定的判断结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210477543.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置