[发明专利]基于FPGA的通用浮点矩阵处理器硬件结构在审
申请号: | 201410690022.5 | 申请日: | 2014-11-25 |
公开(公告)号: | CN104391820A | 公开(公告)日: | 2015-03-04 |
发明(设计)人: | 谷梦媛;王文强;汪玉;郭开元;杨华中 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F15/78 | 分类号: | G06F15/78 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 100084 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于FPGA的通用浮点矩阵处理器硬件结构,包括:多个矩阵运算加速器;提供通用的存储空间且支持加速器间片上高速通信的多个共享矩阵缓存;发送指令,进行运算调度及地址计算的主处理器;检查指令是否存在占用冲突的指令分发器;完成数据传输的直接存取控制器;进行数据分发的仲裁器;提供缓冲的外部存储器;提供访问接口的内存管理单元。本发明实施例的硬件结构可在通用平台上实现“矩阵-矩阵”间运算,可针对不同的应用在主处理器上修改软件程序,可方便的插入矩阵运算加速器结构以实现对多种矩阵运算的支持,具有高度的设计灵活性。同时,该设计具有比以往在嵌入式处理器上进行矩阵运算更低能耗且更高计算性能的优势。 | ||
搜索关键词: | 基于 fpga 通用 浮点 矩阵 处理器 硬件 结构 | ||
【主权项】:
一种基于FPGA的通用浮点矩阵处理器硬件结构,其特征在于,包括:多个矩阵运算加速器,所述多个矩阵运算加速器用于支持三级BLAS库中包含的“矩阵‑矩阵”运算;多个共享矩阵缓存,所述多个共享矩阵缓存用于为所述多个矩阵运算加速器提供通用的存储空间且支持所述多个矩阵运算加速器间片上高速通信;主处理器,所述主处理器用于发送指令,对存储在外存上的大规模矩阵进行分层矩阵运算的调度及地址计算;指令分发器,所述指令分发器用于检查指令对加速器是否存在占用冲突;直接存取控制器,所述直接存取控制器完成外部存储器或主处理器与共享矩阵缓存间的数据传输;仲裁器,所述仲裁器用于在多个矩阵运算加速器及其所需的数据访问模式的缓存端口间进行数据分发;外部存储器,所述外部存储器用于为大规模矩阵提供存储空间,为对加速器发生占用冲突的指令提供缓冲;内存管理单元,所述内存管理单元为多个模块提供外部存储器访问接口。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410690022.5/,转载请声明来源钻瓜专利网。