[发明专利]一种神经网络芯片的功耗优化方法及电路有效
申请号: | 201711121900.1 | 申请日: | 2017-11-14 |
公开(公告)号: | CN107832841B | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 廖裕民;陈幸 | 申请(专利权)人: | 福州瑞芯微电子股份有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/08 |
代理公司: | 福州市鼓楼区京华专利事务所(普通合伙) 35212 | 代理人: | 林晓琴 |
地址: | 350000 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 芯片 功耗 优化 方法 电路 | ||
1.一种神经网络芯片的功耗优化方法,该神经网络芯片包括复数层卷积计算网络层,每个卷积计算网络层包括复数个卷积运算单元,每个卷积运算单元负责对待卷积矩阵的卷积核高度对应的一整行数据块的运算,该待卷积矩阵包括n行数据块并存储在对应的隐藏层矩阵存储单元内,n是整个待卷积矩阵高度除以卷积核处理的单个数据块高度,其特征在于:所述功耗优化方法是:
步骤S1、为每个卷积计算网络层单独设置一电源域,为卷积计算网络层电源域,并连接一卷积计算网络层电源域开关控制单元;
为每个卷积运算单元单独设置一电源域,为卷积电源域,并连接一卷积单元电源域开关控制单元;
将待卷积矩阵中的数据块按行为单位,每行数据块的电源均连接一门控时钟单元,每个门控时钟单元再连接卷积单元时钟开关控制单元;
步骤S2、通过矩阵解析单元对待卷积矩阵的n行数据块进行分析,分析结果通过功耗控制单元控制所述卷积计算网络层电源域开关控制单元、所述卷积单元电源域开关控制单元以及卷积单元时钟开关控制单元,从而控制各卷积计算网络层电源域、各卷积电源域或各门控时钟单元的开或关。
2.根据权利要求1所述的一种神经网络芯片的功耗优化方法,其特征在于:
所述矩阵解析单元对待卷积矩阵的n行数据块进行分析过程是:
(1)按照卷积核的大小对待卷积矩阵进行逐行扫描,逐一判断一整行中每个数据块是否为全零,如果某个数据块为全零,则标注该数据块可以关闭时钟;
(2)在完成一整行数据块的判断后,再对该一整行中全部数据块是否整体为全零做一次判断,如果是说明可以整体关闭该一整行的时钟,则标注用于运算该一整行数据块的卷积运算单元可以关闭卷积电源域;
(3)最后再判断整个待卷积矩阵的数据块是否为全零,如果是则标注该整个卷积计算网络层电源域可关闭。
3.一种神经网络芯片的功耗优化电路,该神经网络芯片包括复数层卷积计算网络层,每个卷积计算网络层包括复数个卷积运算单元,每个卷积运算单元负责对待卷积矩阵的卷积核高度对应的一整行数据块的运算,该待卷积矩阵包括n行数据块并存储在对应的隐藏层矩阵存储单元内,其特征在于:
所述功耗优化电路包括与复数个卷积计算网络层一一对应设置的电源域控制电路,每个电源域控制电路包括矩阵解析单元、功耗控制单元、卷积计算网络层电源域开关控制单元、卷积单元电源域开关控制单元、卷积单元时钟开关控制单元、卷积计算网络层电源域、n个卷积电源域、以及n个门控时钟单元;
所述矩阵解析单元分别连接所述对应的隐藏层矩阵存储单元和所述功耗控制单元;所述功耗控制单元分别连接卷积计算网络层电源域开关控制单元、卷积单元电源域开关控制单元和卷积单元时钟开关控制单元;所述卷积计算网络层电源域开关控制单元连接所述卷积计算网络层电源域;所述卷积单元电源域开关控制单元分别连接n个卷积电源域;所述卷积单元时钟开关控制单元分别连接n个门控时钟单元,每个门控时钟单元分别对应连接一行数据块。
4.根据权利要求3所述的一种神经网络芯片的功耗优化电路,其特征在于:每个所述电源域控制电路中的矩阵解析单元合为一个矩阵解析单元,每个所述电源域控制电路中的功耗控制单元合为一个功耗控制单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州瑞芯微电子股份有限公司,未经福州瑞芯微电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711121900.1/1.html,转载请声明来源钻瓜专利网。