[发明专利]GPU中一种染色片段调度管理的硬件加速实现方法有效
申请号: | 201810797837.1 | 申请日: | 2018-07-19 |
公开(公告)号: | CN108958921B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 吴兴涛;石小刚;黄光新 | 申请(专利权)人: | 南京军微半导体科技有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06T1/20 |
代理公司: | 合肥禾知知识产权代理事务所(特殊普通合伙) 34246 | 代理人: | 卢双双 |
地址: | 210000 江苏省南京市江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了GPU中一种染色片段调度管理的硬件加速实现方法,它涉及GPU设计领域。包括以下步骤:1、染色片段的寄存器配置;2、预判控制;3、输入数据打包;4、存储控制;5、状态控制。本发明可以提高GPU内部像素染色单元的处理性能,并达到节省资源的目的,且该方法支持可配置、可扩展的多通道光栅化后的片段调度任务;最大效率地提升像素染色器的工作效率,并节省硬件设计资源。 | ||
搜索关键词: | gpu 一种 染色 片段 调度 管理 硬件加速 实现 方法 | ||
【主权项】:
1.GPU中一种染色片段调度管理的硬件加速实现方法,其特征在于,包括以下步骤:(1)、染色片段的寄存器配置;(2)、预判控制;(3)、输入数据打包;(4)、存储控制;(5)、输出数据解包;(6)、状态控制;所述的步骤(1)为了实现将光栅化后两个通道内的数据调度到一个CCU中的四个GCU中,同时完成两个GCU处理一个通道数据;并且为了避免调度后的片断数据经过像素染色处理后输出出现先后顺序颠倒问题,约定通道0的数据调度到GCU0和GCU2,通道1的数据调度到GCU1和GCU3,调度管理器中的寄存器配置模块可以完成根据处理器的处理能力不同而调整调度管理器的工作参数,以最大发挥处理器的能力;所述的步骤(2)采用预判控制模块,所述的预判控制模块需要根据光栅化输出的数据的坐标X值以及对应数据属性0来判断这是数据的第一个,并检测该X值参数,具体数值可以根据调度管理器重寄存器配置模块来同步调整,如果处理器的最大工作线程为16,那么需要检测X值对应的第4位来判断应该将该片段调度到哪一个处理器中;所述的步骤(3)采用输入数据打包单元,完成统计输入到每一个存储FIFO模块中的光栅化片段的数量,每当检测到数据属性为0时,数据个数就加1,如果检测到数据个数已经满足了接收从坐标开始所带属性数据的处理器最大线程调度单位的数据后,就停止接收光栅化的数据,并将最后一个数据多发送一次作为结束标记;所述的步骤(4)采用存储控制模块,存储控制模块的内部设计4个同步FIFO,一方面可以存放指定到GCU0、GCU1、GCU2、GCU3的数据,同时可以提高光栅化的工作效率,不至于调度缓慢而导致光栅化停止;所述的步骤(5)采用状态控制模块,根据CCU单元的空闲状态ready信号以及四个处理器GCU的state忙闲状态,采用轮训方案分别从四个FIFO中依次读出数据,最后给发送哪一个GCU的数据包添加ID标识,当GCU检测到ID标识后,可以按照ID号,将ID同步的数据进行处理,避免数据接收紊乱,当GCU按照正确方式接收进行处理后,可以避免由于光栅化同一个坐标数据通过GCU处理后,出现先后顺序颠倒的问题;从每一个FIFO中读出的数据中,可以按照处理器GCU的请求添加需要的数据属性到GCU中,从而完成片段调度管理任务;从而避免采用总线的仲裁任务,节省硬件设计资源,并提高调度效率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京军微半导体科技有限公司,未经南京军微半导体科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810797837.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种分布式任务调度方法及系统
- 下一篇:用于执行任务的方法和装置