[发明专利]可重构处理器及其上多种神经网络激活函数计算方法在审
申请号: | 202011511272.X | 申请日: | 2020-12-18 |
公开(公告)号: | CN112540946A | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 尹首一;邓大峥;谷江源;韩慧明;刘雷波;魏少军 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F15/167 | 分类号: | G06F15/167;G06F15/177;G06F9/30;G06F9/38;G06N3/10;G06N3/04 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 薛平;周晓飞 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 可重构 处理器 及其 多种 神经网络 激活 函数 计算方法 | ||
本发明实施例提供了一种可重构处理器及其上多种神经网络激活函数计算方法,其中,该方法包括:将神经网络激活函数拆分为基础运算;根据神经网络激活函数中各基础运算的计算顺序,通过可重构处理器的可重构处理阵列从共享存储器中读取输入数据来依次实现各基础运算,可重构处理阵列中四周边缘上的处理单元可用于执行访存操作及其他运算操作,称为访存处理单元,可重构处理阵列中除了四周边缘上的处理单元之外的其他处理单元可用于执行运算操作,称为运算处理单元,四周边缘上的处理单元与所在行上的或所在列上的用于执行运算操作的处理单元进行数据传输,可重构处理阵列中每个处理单元与自身上下左右方位上存在的且相邻的处理单元进行数据传输。
技术领域
本发明涉及可重构处理器技术领域,特别涉及一种可重构处理器及其上多种神经网络激活函数计算方法。
背景技术
近年来,随着人工智能、云计算、大数据等技术的发展,人类对计算的需求越来越高,对芯片性能的需求也日益提高。然而,随着芯片尺寸的逐步缩小,摩尔定律逐渐逼近物理极限,集成电路的功率难以继续提升,因此要求芯片设计从功率性能方面的提升转移到能量效率和灵活性方面的提升。因此,能够针对某一领域进行优化设计的专用领域的芯片结构设计则成为了当今芯片设计的主流,而兼顾高性能、高能效比和高灵活性则成为今天芯片设计的重要指标。
同时,随着神经网络的不断发展,网络结构和激活函数也在不断地变化,对于专门的ASIC神经网络加速器,当网络结构和激活函数变化之后,加速的效果便有所下降,甚至不再适用于新型的网络了。
发明内容
本发明实施例提供了一种可重构处理器上多种神经网络激活函数计算方法,以解决现有技术中ASIC神经网络加速器在网络结构和激活函数变化后加速效果低的技术问题。该方法包括:
将神经网络激活函数拆分为基础运算;
根据神经网络激活函数中各基础运算的计算顺序,通过可重构处理器的可重构处理阵列从共享存储器中读取输入数据来依次实现各基础运算,其中,所述可重构处理阵列中四周边缘上的处理单元用于执行访存操作,称为访存处理单元,所述可重构处理阵列中除了四周边缘上的处理单元之外的其他处理单元用于执行运算操作,称为运算处理单元,四周边缘上的处理单元与所在行上的或所在列上的用于执行运算操作的处理单元进行数据传输,所述可重构处理阵列中每个处理单元与自身上下左右方位上存在的且相邻的处理单元进行数据传输。
本发明实施例还提供了一种用于实现多种神经网络激活函数计算的可重构处理器,以解决现有技术中ASIC神经网络加速器在网络结构和激活函数变化后加速效果低的技术问题。该可重构处理阵列包括:
共享存储器,用于存储输入数据;
可重构处理阵列,用于根据神经网络激活函数拆分后各基础运算的计算顺序,从共享存储器中读取输入数据来依次实现各基础运算,其中,所述可重构处理阵列中四周边缘上的处理单元用于执行访存操作,称为访存处理单元,所述可重构处理阵列中除了四周边缘上的处理单元之外的其他处理单元用于执行运算操作,称为运算处理单元,四周边缘上的处理单元与所在行上的或所在列上的用于执行运算操作的处理单元进行数据传输,所述可重构处理阵列中每个处理单元与自身上下左右方位上存在的且相邻的处理单元进行数据传输。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011511272.X/2.html,转载请声明来源钻瓜专利网。