[发明专利]神经网络处理装置及其执行向量复制指令的方法有效
申请号: | 201810914646.9 | 申请日: | 2018-08-08 |
公开(公告)号: | CN109032670B | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 王秉睿;周聖元;张尧 | 申请(专利权)人: | 上海寒武纪信息科技有限公司 |
主分类号: | G06F9/302 | 分类号: | G06F9/302;G06N3/063 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 201306 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 处理 装置 及其 执行 向量 复制 指令 方法 | ||
1.一种处理装置,用于根据向量复制指令执行运算,其特征在于,所述处理装置包括:存储器、运算单元、控制单元和寄存器单元;
所述寄存器单元,用于存储向量复制指令;所述向量复制指令包括操作码和操作域,所述操作码用于指示进行向量复制运算;所述操作域包括:稀疏向量sX5中元素的首地址、所述稀疏向量sX5的索引的首地址、稀疏向量sY5中元素的首地址和稀疏向量sY5的索引的首地址;
所述存储器,用于存储参与向量复制运算的数据;
所述控制单元,用于从所述寄存器单元中获取所述向量复制指令,解析所述向量复制指令,以得到所述操作码和操作域;根据所述操作域从所述存储器中获取所述参与向量复制运算的数据和所述参与向量复制运算的数据中部分数据或者全部数据的索引;并将所述参与向量复制运算的数据传输至所述运算单元;具体用于:根据所述稀疏向量sX5中元素的首地址从所述存储器中获取所述稀疏向量sX5;根据所述稀疏向量sX5的索引的首地址从所述存储器中获取所述稀疏向量sX5的索引;并将所述稀疏向量sX5及其索引传输至所述运算单元;
所述运算单元,用于对所述参与向量复制运算的数据进行向量复制运算,具体用于:将所述稀疏向量sX5中的元素复制到所述稀疏向量sY5中元素的首地址对应的存储空间中;将所述稀疏向量sX5的索引复制到所述稀疏向量sY5的索引的首地址对应的存储空间中;
其中,所述处理装置还包括:
依赖关系处理单元,用于确定第s个向量复制指令与所述第s个向量复制指令之前的第s-1个向量复制指令是否存在关联关系,如所述第s个向量复制指令与所述第s-1个向量复制指令存在关联关系,将所述第s个向量复制指令缓存在指令存储单元内,在所述第s-1个向量复制指令执行完毕后,从所述指令存储单元提取所述第s个向量复制指令传输至所述运算单元;
所述确定该第s个向量复制指令与第s个向量复制指令之前的第s-1个向量复制指令是否存在关联关系包括:
依据所述第s个向量复制指令提取所述第s个向量复制指令中所需数据的第一存储地址区间,依据所述第s-1个向量复制指令提取所述第s-1个向量复制指令中所需数据的第零存储地址区间,如所述第一存储地址区间与所述第零存储地址区间具有重叠的区域,确定所述第s个向量复制指令与所述第s-1个向量复制指令具有关联关系,如所述第一存储地址区间与所述第零存储地址区间不具有重叠的区域,确定所述第s个向量复制指令与所述第s-1个向量复制指令不具有关联关系。
2.根据权利要求1所述的处理装置,其特征在于,所述操作域还包括:所述稀疏向量sX5的索引表示方式和所述稀疏向量sY5的索引表示方式,且稀疏向量sX5的索引表示方式和稀疏向量sY5的索引表示方式不一致;所述控制单元具体用于:
在获取所述稀疏向量sX5的索引后,将所述稀疏向量sX5的索引转换为以所述稀疏向量sY5的索引表示方式表的索引,以得到第三索引;并将所述第三索引传输至所述运算单元;
所述运算单元将所述第三索引复制至所述稀疏向量sY5的索引的首地址对应的存储空间。
3.根据权利要求1或2所述的处理装置,其特征在于,所述操作域还包括:所述稀疏向量sX5中元素的个数;所述控制单元还用于:
根据所述稀疏向量sX5中元素的个数和所述稀疏向量sX5中元素的首地址从所述存储器中获取所述稀疏向量sX5;并将所述稀疏向量sX5传输至所述运算单元;
所述运算单元还用于:
将所述稀疏向量sX5中的元素复制到所述稀疏向量sY5中元素的首地址对应的存储空间中。
4.根据权利要求1或2所述的处理装置,其特征在于,输入数据的索引表示方式还包括:直接索引表示方式或步长索引表示方式;
当所述输入数据的索引表示方式为直接索引表示方式时,所述输入数据的索引为由0和1组成的字符串,0表示所述输入数据中元素不满足预设条件,1表示所述输入数据中的元素满足所述预设条件,或者;
当所述输入数据的索引表示方式为步长索引表示方式时,所述输入数据的索引为所述输入数据中满足所述预设条件的元素与上一个满足所述预设条件的元素之间的距离值组成的字符串;
其中,所述预设条件为:所述输入数据中的元素的绝对值大于或者小于预设阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海寒武纪信息科技有限公司,未经上海寒武纪信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810914646.9/1.html,转载请声明来源钻瓜专利网。