[发明专利]线程构造方法及其装置有效
申请号: | 202210756644.8 | 申请日: | 2022-06-30 |
公开(公告)号: | CN115034950B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 张淮声;陈翔翔;李宝华 | 申请(专利权)人: | 格兰菲智能科技有限公司 |
主分类号: | G06T1/20 | 分类号: | G06T1/20;G06F9/38;G06F9/48 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 李志健 |
地址: | 200135 上海市浦东新区中国*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 线程 构造 方法 及其 装置 | ||
本申请涉及一种线程构造方法及其装置。该方法包括:将工作负载划分成多个工作组;对于任一工作组,选择与所述任一工作组大小相匹配的样板类型,并在所述样板类型对应的多个候选线程构造样板中,确定目标线程构造样板;按照所述目标线程构造样板构造多个线程;所述线程包括由所述任一工作组中的多个连续工作项所组成;缓存各线程工作项序列中至少一个关键工作项对应的工作项索引,得到各线程的工作项索引;用于将对应所述线程中的任意工作项调度至负责处理所述线程的处理单元。采用本方法能够提高线程构造效率。
技术领域
本申请涉及图形处理器技术领域,特别是涉及通用图形处理器基于样板的线程构造方法及其装置。
背景技术
随着科技的飞速发展,图形处理器(Graphics Processing Unit,GPU)包含大量的并行处理单元,可以通过编程,进行单指令多数据流(Single Instruction MultipleData,SIMD)的并行计算,这使得GPU不仅仅可用于图形绘制的硬件加速,更多地可以应用到通用图形处理器的并行计算中。例如,图像的滤波降噪、视频压缩、物理仿真、人工智能、科学计算等等。GPU的通用计算,称为GPGPU,全称为General Purpose Computing on GPU,随着GPU在性能上的飞速发展,利用GPU加速处理的技术逐渐成为研究热点。
然而,传统技术中的GPU硬件在构造SIMD线程的时候,线程构造单元需要专门为每个工作项一一生成索引参数,这使得线程构造单元会消耗大量的计算时间,同时需要存储每个工作项的索引参数信息,造成线程构造效率低下且占用较大的存储空间。有鉴于此,本发明提供一种基于样板的线程构造方法及其装置,能够提高线程构造效率并且能大大减少额外的存储空间。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高线程构造效率的线程构造方法及其装置。
第一方面,本申请提供了一种线程构造方法,所述方法包括:
将工作负载划分成多个工作组;
对于任一工作组,选择与所述任一工作组大小相匹配的样板类型,并在所述样板类型对应的多个候选线程构造样板中,确定目标线程构造样板;
按照所述目标线程构造样板构造多个线程;所述线程由所述任一工作组中的多个连续工作项所组成;
缓存各线程工作项序列中至少一个关键工作项对应的工作项索引,得到各线程的工作项索引;用于将对应所述线程中的任意工作项调度至负责处理所述线程的处理单元。
在其中一个实施例中,所述确定目标线程构造样板,包括:
获取各所述候选线程构造样板在计算空间中至少一个方向上的步进步距;
根据各所述步进步距和所述工作组大小,确定步进步距与所述工作组大小之间的数量关系满足预设条件的候选线程构造样板为所述目标线程构造样板。
在其中一个实施例中,所述按照目标线程构造样板构造多个线程,包括:
获取所述目标线程构造样板在计算空间中至少一个方向上的步进步距;
按照所述步进步距将所述任一工作组中的多个连续工作项构造成多个所述线程。
在其中一个实施例中,所述关键工作项为各线程中的第一个工作项,所述缓存各线程工作项序列中至少一个关键工作项对应的工作项索引,得到各线程的工作项索引,包括:
获取所述第一个工作项对应的工作组索引、局部索引和全局索引;
根据所述工作组索引、局部索引和全局索引,确定所述关键工作项对应的工作项索引;
将所述关键工作项索引缓存至缓存单元。
在其中一个实施例中,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于格兰菲智能科技有限公司,未经格兰菲智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210756644.8/2.html,转载请声明来源钻瓜专利网。