[发明专利]用于将工作负荷有效地提交到高性能图形子系统的方法和装置在审
申请号: | 201780010516.6 | 申请日: | 2017-01-17 |
公开(公告)号: | CN108604185A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | B·文布;K·巴拉;M·拉马多斯;H·纳卢瑞;J·波尔斯;J·弗里泽尔;J·科斯顿 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38;G06T1/20 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 张欣;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图形处理子系统 队列 图形引擎 调度器 构建 存储器映射 方法和装置 高性能图形 工作负荷 工作项 有效地 映射 显式 写入 调度 配置 | ||
1.一种装置,包括:
图形处理子系统,包括一个或多个图形引擎;以及
图形调度器,用于调度用于在所述图形处理子系统的所述一个或多个图形引擎上执行的多个工作项的提交队列,所述图形调度器用于经由对被映射到所述图形处理子系统内的逻辑的存储器映射地址的写入来构建所述提交队列,并且在所述提交队列的构建之后将所述提交队列显式地提交给所述图形引擎。
2.如权利要求1所述的装置,其特征在于,所述提交队列具有引用所述多个工作项的最大数量的元素,并且所述图形调度器用于以少于所述最大数量的元素将所述提交队列提交给所述图形引擎。
3.如权利要求2所述的装置,其特征在于,所述图形调度器用于在所述提交队列被提交之后附加上另外的工作项。
4.如权利要求1所述的装置,其特征在于,所述一个或多个图形引擎用于在所述图形调度器显式地提交所述提交队列之后执行在所述提交队列中在执行队列中的所述多个工作项。
5.如权利要求4所述的装置,其特征在于,所述图形调度器用于对所述存储器映射地址进行写入,并且使得所述图形处理子系统的所述一个或多个图形引擎中的一个抢占正在执行的工作项。
6.如权利要求5所述的装置,其特征在于,所述一个或多个图形引擎用于抢占现有的工作项并转换到空闲状态。
7.如权利要求6所述的装置,其特征在于,所述图形处理子系统包括上下文存储存储器,所述上下文存储存储器用于存储与被抢占并被转换到所述空闲状态的图形引擎的正在执行上下文相关联的信息,并且在转换到所述空闲状态之前将与所述正在执行的工作项相关联的上下文信息存储到上下文存储存储器中。
8.如权利要求7所述的装置,其特征在于,所述一个或多个图形引擎中的被抢占并且被转换到所述空闲状态的所述图形引擎用于在转换到所述空闲状态之前将所述执行队列存储到所述提交队列作为部分执行的提交队列,并且所述图形处理系统进一步用于在转换到所述空闲状态之后将所述图形引擎转换到低功率状态。
9.如权利要求8所述的装置,其特征在于,所述图形处理子系统用于将空闲的图形引擎转换到可操作状态,并且所述图形调度器用于经由寄存器写入将所述部分执行的提交队列重新提交给所述图形引擎。
10.一种计算机实现的方法,包括:
接收用于提交到图形引擎的一批一个或多个工作项的标识符;
选择所述一批一个或多个工作项要被提交到所述一个户多个图形引擎中的哪一个;
将用于所述一批一个或多个工作项的所述标识符插入到与所选图形引擎相关联的提交队列的元素中;以及
通过对控制寄存器进行写入将所述元素显式地提交到所述提交队列中。
11.如权利要求10所述的计算机实现的方法,其特征在于,在完成所选图形引擎的执行队列时,提交所述提交队列中的元素。
12.如权利要求11所述的计算机实现的方法,附加地包括:
在将所述元素提交到所述提交队列中之前,对所述控制寄存器的抢占选择器进行写入;
停止对所述所选图形引擎的执行队列中的元素的执行;以及
开始所述提交队列中的所述元素的执行。
13.如权利要求12所述的计算机实现的方法,附加地包括在开始所述元素的执行之前,将所述元素从所述提交队列复制到所述执行队列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780010516.6/1.html,转载请声明来源钻瓜专利网。