[发明专利]一种高兼容性可编程神经网络加速阵列在审
申请号: | 201711131564.9 | 申请日: | 2017-11-15 |
公开(公告)号: | CN107817708A | 公开(公告)日: | 2018-03-20 |
发明(设计)人: | 陈迟晓;史传进;张怡云 | 申请(专利权)人: | 复旦大学 |
主分类号: | G05B19/04 | 分类号: | G05B19/04 |
代理公司: | 上海正旦专利代理有限公司31200 | 代理人: | 陆飞,陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 兼容性 可编程 神经网络 加速 阵列 | ||
本发明属于集成电路技术领域,具体为一种高兼容性可编程神经网络加速阵列。该阵列采用可重构性架构,包含一个中央控制器、一个特征向量发射器以及若干个神经网络计算单元片;所述计算单元片含有可编程乘加单元、可编程激活单元、单元片控制器等基本的神经网络计算模块,加速阵列通过可编程通信路由进行任意单元片间的通信。该可编程神经网络加速阵列可兼容多种神经网络算法,同时又不失去高能效,适合应用于各类深度学习智能系统中。
技术领域
本发明属于集成电路技术领域,具体涉及一种高兼容性可编程神经网络加速阵列。
背景技术
如今在移动设备上开发定制深度学习加速芯片日渐趋热,其挑战在于,芯片的性能受限于深度学习网络类型,例如CNN(卷积神经网络)、RNN(循环神经网络),为了设计出高能效的定制深度学习加速芯片,往往芯片会针对某些网络进行优化,在使用这些网络时性能很高,而其他网络下性能欠佳。然而,由于近期深度学习领域的迅猛发展,将来可能会出现改进版本的CNN或RNN网络,甚至有其他新的深度学习神经网络算法出现,那么现有的专用型深度学习加速芯片将达不到所需的性能要求,从根本上限制了深度学习智能的发展。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种高兼容性可编程神经网络加速阵列。
本发明提供的高兼容性可编程神经网络加速阵列,该阵列采用可重构性架构,包含一个中央控制器、一个特征向量发射器以及若干个神经网络计算单元片。其中:
所述的中央控制器负责深度学习神经网络的全局控制;
所述的特征向量发射器负责向所有所述神经网络计算单元片发射所需的特征向量;
所述的神经网络计算单元片含有基本的神经网络计算模块,包括但不限于可编程乘加单元、可编程激活单元、单元片控制器及缓存(可选);
所述的神经网络计算单元片通过可编程通信路由可进行任意单元片间的通信。
本发明的技术效果是,该神经网络加速阵列架构的可重构性、计算单元片中计算模块的可编程性及单元片间通信的可编程性,拥有极大的灵活性,通过编程可任意组合计算方式、数据存储、数据走向,可兼容各类深度学习网络拓扑结构,以及未来可能出现的新算法,并同时保持高能效,在应用深度学习算法的人工智能系统中有很大的应用前景。
附图说明
图1是本发明的高兼容性可编程神经网络加速阵列架构示意图。
图2是本发明的神经网络计算单元片的结构示意图。
图3是本发明的神经网络计算单元片间通信路由的通信示意图。
图4是本发明的神经网络计算单元片具体实施例示意图。
图中标号:11为中央控制器,12为特征向量发射器,13为神经网络计算单元片;21为可编程乘加单元,22为可编程激活单元,23为单元控制器,24为缓存;31为计算单元片间通信路由。
具体实施方式
在下文中结合图示在参考实施例中更完全地描述本发明,本发明提供优选实施例,但不应该被认为仅限于在此阐述的实施例。
图1所示为本发明的高兼容性可编程神经网络加速阵列架构示意图,其中,中央控制器11负责深度学习神经网络的全局控制,特征向量发射器12负责向所有神经网络计算单元片13发射所需特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711131564.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种获得滤波器的方法和滤波器
- 下一篇:一种基于多传感器的数据采集系统