[发明专利]用于加速图形分析的装置和方法在审
申请号: | 201680070403.0 | 申请日: | 2016-11-18 |
公开(公告)号: | CN108292220A | 公开(公告)日: | 2018-07-17 |
发明(设计)人: | M·安德森;S·李;J·S·朴;M·M·A·帕特瓦里;N·R·萨蒂什;M·斯密尔安斯基;N·森达拉姆 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 李炜;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 程序代码 集合 加速图形 指令取出单元 图形加速器 方法描述 处理器 取出 分析 | ||
1.一种处理器,包括:
指令取出单元,用于取出包括集合交和集合并操作的程序代码;
图形加速器单元(GAU),用于执行所述程序代码的、与所述集合交和集合并操作有关的至少第一部分,并生成结果;以及
执行单元,用于使用从所述GAU提供的所述结果来执行所述程序代码的至少第二部分。
2.如权利要求1所述的处理器,其中,所述GAU用于标识与所述集合交和/或集合并操作相关联的重复的键。
3.如权利要求2所述的处理器,其中,所述GAU用于:对于集合交,进一步标识匹配的索引,聚集与所述匹配的索引相对应的值,并连续地将所述值复制到两个输出流中;对于集合并,标识匹配的索引,去除重复值,并生成待处理的输出集和至少两个重复索引向量,所述结果包括所述两个输出流、所述输出集以及所述至少两个重复索引向量。
4.如权利要求3所述的处理器,其中,所述执行单元用于:对于集合交,对所述输出流执行约简;以及对于集合并,使用所述重复索引向量来从第二输入集聚集元素,并将所述元素约简到所述输出集中。
5.如权利要求4所述的处理器,其中,所述执行单元用于:对于集合交,执行多个点积操作以对所述输出流执行约简。
6.如权利要求5所述的处理器,其中,所述执行单元用于:对紧缩数据执行多个单指令多数据(SIMD)操作,以便对于集合交对所述输出流执行约简,并且对于集合并使用所述重复索引向量。
7.如权利要求1所述的处理器,进一步包括:
在一个或多个核内部的共享高速缓存,所述GAU用于:通过将所述GAU的结果复制到所述共享高速缓存来将所述结果提供给所述执行单元。
8.如权利要求7所述的处理器,其中,所述共享高速缓存包括第二级(L2)高速缓存。
9.如权利要求1所述的处理器,其中,集合操作描述控制块(CB)将被写入被指派给所述GAU的特定的存储器位置,所述GAU用于访问所述集合操作控制块来执行所述GAU的操作。
10.如权利要求1所述的处理器,进一步包括:
状态标记,当所述GAU完成操作时将由所述GAU更新,所述执行单元用于迭代地检查所述状态标记以被通知关于完成的情况。
11.如权利要求1所述的处理器,进一步包括:
内容可寻址存储器(CAM),通信地耦合至所述GAU或在所述GAU内部,所述CAM用于存储与所述集合交和/或集合并操作有关的一个或多个索引向量。
12.如权利要求11所述的处理器,其中,所述GAU包括集合处理引擎(SPE)的阵列,每个SPE将由有限状态机(FSM)驱动,并配置成用于执行并或交操作。
13.一种方法,包括:
取出包括集合交和集合并操作的程序代码;
在图形加速器单元(GAU)上执行所述程序代码的、与所述集合交和集合并操作有关的至少第一部分,并生成结果;以及
在执行单元上,使用从所述GAU提供的所述结果来执行所述程序代码的至少第二部分。
14.如权利要求13所述的方法,其中,所述GAU用于标识与所述集合交和/或集合并操作相关联的重复的键。
15.如权利要求14所述的方法,其中,所述GAU用于:对于集合交,进一步标识匹配的索引,聚集与所述匹配的索引相对应的值,并连续地将所述值复制到两个输出流中;对于集合并,标识匹配的索引,去除重复值,并生成待处理的输出集和至少两个重复索引向量,所述结果包括所述两个输出流、所述输出集以及所述至少两个重复索引向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680070403.0/1.html,转载请声明来源钻瓜专利网。