[发明专利]加速人工智能处理器的硬件架构在审

申请号：	201810862182.1	申请日：	2018-08-01
公开（公告）号：	CN109191364A	公开（公告）日：	2019-01-11
发明（设计）人：	李云鹏;倪岭;邵平平;刘伟栋;蔡敏	申请（专利权）人：	南京天数智芯科技有限公司
主分类号：	G06T1/20	分类号：	G06T1/20
代理公司：	南京钟山专利代理有限公司 32252	代理人：	戴朝荣
地址：	210012 江苏省南***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	引擎渲染器人工智能枕形颞叶硬件架构处理器前叶内存主机工作分区可扩展性可配置的输出特征输入特征数据压缩分配平行写入发送架构输出积累
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种加速人工智能处理器的硬件架构，其特征在于，人工智能工作被视为5D张量，在每一维度中，工作被分成若干组，每一组进一步被分成若干波；

其中，硬件架构包括：主机、前叶引擎、顶叶引擎、渲染器引擎、枕形引擎、颞叶引擎和内存；前叶引擎从主机得到5D张量，并将其分为若干组张量，并将这些组张量发送至顶叶引擎；顶叶引擎获取组张量并将其分成若干张量波，顶叶引擎将这些张量波发送到渲染器引擎，以执行输入特征渲染器，并将部分张量输出到枕形引擎；枕形引擎积累部分张量，并执行输出特征渲染器，以获得发送到颞叶引擎的最终张量；颞叶引擎进行数据压缩，并将最终张量写入内存中。

2.如权利要求1所述的一种加速人工智能处理器的硬件架构，其特征在于：每个顶叶引擎根据用户定义的输入特征渲染器处理组张量，并将部分和输出到枕形引擎中。

3.如权利要求1所述的一种加速人工智能处理器的硬件架构，其特征在于：在统一渲染架构中，执行输出特征渲染器具体为：输出特征渲染器被发送回顶叶引擎，一旦顶叶引擎完成渲染，将结果发送回枕形引擎。

4.如权利要求1所述的一种加速人工智能处理器的硬件架构，其特征在于：在分离渲染架构中，执行输出特征渲染器具体为：输出特征渲染器在枕形引擎中进行处理，枕形引擎将输出张量发送到颞叶引擎，颞叶引擎进行后处理，并将其发送到DRAM或者保持在缓存中以进一步处理。

5.如权利要求1所述的一种加速人工智能处理器的硬件架构，其特征在于：顶叶引擎的数量是可配置的，前叶引擎以轮询调度的方式将组张量发送给顶叶引擎，每个顶叶引擎由特定的流式感知器处理器组成，所有的流式感知器处理器共享一个L2缓存和一个导出块。

6.如权利要求5所述的一种加速人工智能处理器的硬件架构，其特征在于：流式感知器处理器由运算器和作为计算核心的神经元组成，运算器核用于一般计算，神经元核用于人工智能计算，神经元由L1缓存和乘法累加器组成。

7.如权利要求6所述的一种加速人工智能处理器的硬件架构，其特征在于：张量波被发送到神经元，神经元在张量波上运行输入特征渲染器，结果被导出到枕形引擎，枕形引擎进行必要的累加后将结果发送回顶叶引擎，顶叶引擎在运算器上进行输出特征渲染器，并将结果输出到颞叶引擎。

8.如权利要求6所述的一种加速人工智能处理器的硬件架构，其特征在于：顶叶引擎的数量为4个，每个顶叶引擎有2个流式感知器处理器，每个流式感知器处理器有4个神经元，每个神经元有8个乘法累加器组，每个乘法累加器组有4个乘法累加器。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京天数智芯科技有限公司，未经南京天数智芯科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810862182.1/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T1-00 通用图像数据处理
G06T1-20 .处理器结构；处理器配置，例如流水线
G06T1-60 .存储器管理
G06T1-40 ..神经网络

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]加速人工智能处理器的硬件架构在审

专利文献下载