[发明专利]配置向量运算系统中的协作线程束的装置和方法在审
申请号: | 202210479765.2 | 申请日: | 2020-10-21 |
公开(公告)号: | CN114816529A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海壁仞智能科技有限公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F17/16 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 张平 |
地址: | 201114 上海市闵行区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 配置 向量 运算 系统 中的 协作 线程 装置 方法 | ||
1.一种配置向量运算系统中的协作线程束的装置,其特征在于,包含:
通用寄存器;
算术逻辑单元,耦接所述通用寄存器;
线程束指令调度器,耦接所述算术逻辑单元,所述线程束指令调度器依据程序核中的线程束分配指令让多个线程束中的每一个包含所述程序核中的一部分相对独立指令,依据软件在执行时的配置让所述多个线程束中的每一个都通过所述算术逻辑单元存取所述通用寄存器中的全部或指定局部的数据,并通过所述算术逻辑单元完成每个上述线程束的运算;以及
多个各线程束资源寄存器,其中,每个所述各线程束资源寄存器关联于一个所述线程束,用于让每个所述线程束搭配相应的所述各线程束资源寄存器的内容,将数据存取映射到所述通用寄存器中的指定局部,其中不同的所述线程束间所映射的所述通用寄存器中的指定局部并不重叠。
2.如权利要求1所述的配置向量运算系统中的协作线程束的装置,其特征在于,所述装置不预先为每个所述线程束配置关联于所述通用寄存器中的全部或指定局部。
3.如权利要求1所述的配置向量运算系统中的协作线程束的装置,其特征在于,所述线程束包含第一线程束和第二线程束,所述线程束指令调度器从指令缓存获取所述第一线程束的屏障指令时,让所述第一线程束进入等待状态,以及所述线程束指令调度器从所述指令缓存获取所述第二线程束的屏障指令时,唤醒所述第一线程束,其中所述第一线程束和所述第二线程束被配置关联于所述通用寄存器中重叠的一块。
4.如权利要求3所述的配置向量运算系统中的协作线程束的装置,其特征在于,所述第一线程束为消费者线程束,所述第二线程束为生产者线程束。
5.如权利要求1所述的配置向量运算系统中的协作线程束的装置,其特征在于,所述线程束之间互相独立,每个所述线程束被配置关联于所述通用寄存器中不重叠的一块。
6.如权利要求1所述的配置向量运算系统中的协作线程束的装置,其特征在于,所述线程束指令调度器为每个所述线程束维护独立的程序计数器。
7.一种配置向量运算系统中的协作线程束的方法,执行在流多处理器之中,其特征在于,包含:
依据程序核中的线程束分配指令让多个线程束中的每一个包含所述程序核中的一部分相对独立指令;
依据软件在执行时的配置让所述多个线程束中的每个通过算术逻辑单元存取通用寄存器中的全部或指定局部的数据;以及
通过所述算术逻辑单元完成每个上述线程束的运算,
其中所述方法还包括:
依据多个各线程束资源寄存器的内容让每个所述线程束的数据存取映射到所述通用寄存器中的指定局部,并且其中不同的所述线程束间映射的所述通用寄存器中的指定局部并不重叠。
8.如权利要求7所述的配置向量运算系统中的协作线程束的方法,其特征在于,所述流多处理器不预先为每个所述线程束配置关联于所述通用寄存器中的全部或指定局部。
9.如权利要求7所述的配置向量运算系统中的协作线程束的方法,其特征在于,所述线程束包含第一线程束和第二线程束,所述第一线程束和所述第二线程束被配置关联于所述通用寄存器中重叠的一块,所述方法包含:
从指令缓存获取所述第一线程束的屏障指令时,让所述第一线程束进入等待状态;以及
从所述指令缓存获取所述第一线程束的屏障指令时,唤醒所述第二线程束。
10.如权利要求9所述的配置向量运算系统中的协作线程束的方法,其特征在于,所述第一线程束为消费者线程束,所述第二线程束为生产者线程束。
11.如权利要求7所述的配置向量运算系统中的协作线程束的方法,其特征在于,包含:
为每个所述线程束维护独立的程序计数器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海壁仞智能科技有限公司,未经上海壁仞智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210479765.2/1.html,转载请声明来源钻瓜专利网。