[发明专利]卷积扩展指令的执行方法以及相关产品在审
申请号: | 201711086019.2 | 申请日: | 2017-11-07 |
公开(公告)号: | CN109754062A | 公开(公告)日: | 2019-05-14 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海寒武纪信息科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 200120 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 扩展指令 辅助操作 卷积核 计算装置 操作域 寄存器 存储器读取 降低功耗 操作码 计算量 | ||
1.一种卷积扩展指令的执行方法,其特征在于,所述方法包括如下步骤:
计算装置从存储器读取所述卷积扩展指令获取所述卷积扩展指令的输入数据、卷积核以及激活操作;
所述卷积扩展指令包括:操作码和操作域,所述操作码包括:所述卷积扩展指令的标识;所述操作域包括:卷积子域和激活子域,所述卷积子域包括:存储输入数据的地址和卷积核的地址,所述激活子域包括:所述激活操作的标识码或所述激活操作的插值表地址;
计算装置对所述输入数据和卷积核执行卷积运算得到中间结果,通过所述激活子域对所述中间结果执行激活操作得到所述指令的最终结果。
2.根据权利要求1所述的方法,其特征在于,
所述激活操作包括:卷积神经网络Maxout操作、卷积神经网络PReLU操作、卷积神经网络RReLU操作、卷积神经网络Leaky ReLU操作、非线性激活操作或线性激活操作操作。
3.根据权利要求1所述的方法,其特征在于,如所述激活子域包括:激活操作的插值表地址,所述通过所述激活子域对所述中间结果执行激活操作得到所述指令的最终结果,包括:
计算装置提取所述激活操作的插值表地址对应的插值表,将所述中间结果与所述插值表执行激活运算得到所述指令的最终结果。
4.根据权利要求1所述的方法,其特征在于,如所述激活子域包括:激活操作的标识码,所述通过所述激活子域对所述中间结果执行激活操作得到所述指令的最终结果,包括:
计算装置识别所述激活操作的标识码确定所述激活操作,读取所述激活操作的插值表,将所述插值表与所述中间结果执行激活运算得到所述指令的最终结果。
5.根据权利要求1所述的方法,其特征在于,所述计算装置对所述输入数据和卷积核执行卷积运算得到中间结果,包括:
计算装置的主运算模块将所述输入数据拆分成多个部分得到多个输入子数据,将多个输入子数据分发给多个从运算模块,将卷积核发送给多个从运算模块,所述多个从运算模块并行执行输入子数据与卷积核的乘法运算得到多个子结果,计算装置的主运算模块将所述多个子结果拼接得到所述中间结果。
6.一种计算装置,其特征在于,所述计算装置包括:存储器、运算单元、互联模块、运算单元、控制器单元和数据访问单元;
其中,所述运算单元,包括:加法运算器、乘法运算器;
控制器单元,用于从存储器读取所述卷积扩展指令获取所述卷积扩展指令的输入数据、卷积核以及激活操作;
所述卷积扩展指令包括:操作码和操作域,所述操作码包括:所述卷积扩展指令的标识;所述操作域包括:卷积子域和激活子域,所述卷积子域包括:存储输入数据的地址和卷积核的地址,所述激活子域包括:所述激活操作的标识码或所述激活操作的插值表地址;
数据访问单元,用于获取所述输入数据的地址和卷积核的地址对应的输入数据以及卷积核;
所述运算单元,用于对所述输入数据和卷积核执行卷积运算得到中间结果,通过所述激活子域对所述中间结果执行激活操作得到所述指令的最终结果。
7.根据权利要求6所述的计算装置,其特征在于,
所述激活操作包括:卷积神经网络Maxout操作、卷积神经网络PReLU操作、卷积神经网络RReLU操作、卷积神经网络Leaky ReLU操作、非线性激活操作或线性激活操作操作。
8.根据权利要求6所述的计算装置,其特征在于,如所述激活子域包括:激活操作的插值表地址;
所述数据访问单元,用于提取所述激活操作的插值表地址对应的插值表;
所述运算单元,用于将所述中间结果与所述插值表执行激活运算得到所述指令的最终结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海寒武纪信息科技有限公司,未经上海寒武纪信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711086019.2/1.html,转载请声明来源钻瓜专利网。