[发明专利]图形处理器的硬件模拟方法和计算机可读存储介质在审
申请号: | 202210113225.2 | 申请日: | 2022-01-30 |
公开(公告)号: | CN114490221A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海壁仞智能科技有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22;G06F11/34 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 彭久云 |
地址: | 201100 上海市闵行区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图形 处理器 硬件 模拟 方法 计算机 可读 存储 介质 | ||
1.一种图形处理器的硬件模拟方法,由处理单元执行,其特征在于,包括:
依据用户程序中所调用的相应于第二类型图形处理器的程序语言接口中的精简函数和实际参数,通过第一类型图形处理器的编程接口引入相应于第一类型图形处理器的指令,用于使用所述第一类型图形处理器来模拟所述程序语言接口中的所述精简函数,
其中,所述精简函数原本用于驱动所述第二类型图形处理器以完成指定功能。
2.如权利要求1所述的图形处理器的硬件模拟方法,其特征在于,包括:
编译相应于所述第一类型图形处理器的所述指令以生成二进制代码;以及
驱动所述第一类型图形处理器的硬件以执行所述二进制代码。
3.如权利要求2所述的图形处理器的硬件模拟方法,其特征在于,所述第一类型图形处理器的编译器编译相应于所述第一类型图形处理器的所述指令。
4.如权利要求3所述的图形处理器的硬件模拟方法,其特征在于,所述第一类型图形处理器的所述编译器无法编译所述用户程序中所调用的相应于所述第二类型图形处理器的所述程序语言接口中的所述精简函数和所述实际参数。
5.如权利要求1所述的图形处理器的硬件模拟方法,其特征在于,所述精简函数为线程束的加载函数,用于从随机存取存储器的指定地址读取一整列、一整行或者一个小分片的数据,并且存储到所述第二类型图形处理器的通用寄存器中的指定地址。
6.如权利要求5所述的图形处理器的硬件模拟方法,其特征在于,相应于所述第一类型图形处理器的所述指令包含一个反复执行的循环,以及在每次迭代中,计算一个线程的来源坐标和目的地址,所述来源坐标用于关联到所述随机存取存储器的特定地址,以及所述目的地址指向所述第一类型图形处理器中的计算单元的特定通用寄存器。
7.如权利要求1所述的图形处理器的硬件模拟方法,其特征在于,所述精简函数为线程束的存储函数,用于从所述第二类型图形处理器的通用寄存器中的指定地址读取一整列、一整行或者一个小分片的数据,并且存储到随机存取存储器的指定地址。
8.如权利要求7所述的图形处理器的硬件模拟方法,其特征在于,相应于所述第一类型图形处理器的所述指令包含一个反复执行的循环,以及在每次迭代中,计算一个线程的来源坐标和目的地址,所述来源坐标用于关联到所述第一类型图形处理器中的计算单元的特定通用寄存器,以及所述目的地址指向所述随机存取存储器的特定地址。
9.如权利要求1所述的图形处理器的硬件模拟方法,其特征在于,所述精简函数为线程束层次的池化运算函数,用于从随机存取存储器的指定地址读取目标小分片和邻近小分片的数据,依据读取的数据针对目标小分片进行池化运算,并且存储运算结果。
10.如权利要求9所述的图形处理器的硬件模拟方法,其特征在于,相应于所述第一类型图形处理器的所述指令包含:配置足够存储所述目标小分片和所述邻近小分片的数据的空间;从随机存取存储器的指定地址读取目标小分片和邻近小分片的数据,并且将读取的数据存储至配置的所述空间;以及并行地依据所述目标小分片和所述邻近小分片的数据对所述目标小分片中的多组数据进行池化运算,并且存储计算结果。
11.一种计算机可读取存储介质,用于存储能够被处理单元执行的程序代码,其特征在于,所述程序代码被所述处理单元执行时实现如权利要求1至权利要求10中任一项所述的图形处理器的硬件模拟方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海壁仞智能科技有限公司,未经上海壁仞智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210113225.2/1.html,转载请声明来源钻瓜专利网。