[发明专利]用于查询计划优化以及数据并行编程模型的共同范围分区无效
申请号: | 201210081362.9 | 申请日: | 2012-03-23 |
公开(公告)号: | CN102831139A | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | 柯启发;Y·余 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 杨洁 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及用于查询计划优化以及数据并行编程模型的共同范围分区。共同范围分区方案利用自动计算出的范围键的共同集合,将多个静态或动态生成的数据集划分成平衡分区。共同范围分区管理器通过在执行计划图中尽可能早地将共同范围分区应用到它的一对前辈节点,来为多源运算符(例如,联结)最小化数据分区运算符的数量。因此,减少了被传输的数据的量。通过对数据分区任务使用自动范围和共同范围分区,启用编程API,该API提取来自用户的显式数据分区,以便为计算机群集中的数据并行编程提供顺序编程模型。 | ||
搜索关键词: | 用于 查询 计划 优化 以及 数据 并行 编程 模型 共同 范围 分区 | ||
【主权项】:
一种用于并行计算的数据分区方法,包括:在执行在计算设备的处理器上的共同范围分区管理器(110)处接收(402)输入数据集,所述输入数据集与多源运算符相关联;在编译时确定(404)静态执行计划图EPG;平衡(408)与输入数据集相关联的工作负载,以获得多个近似相等的工作负载分区以便由分布式执行引擎处理;确定(410)所述分区的多个范围键;以及根据分区数量N在运行时重写(414)EPG。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210081362.9/,转载请声明来源钻瓜专利网。
- 上一篇:五轴中低速点胶机器人伺服控制系统
- 下一篇:一种大功率盘式永磁电机定子