[发明专利]SLAM运算装置和方法有效
申请号: | 201811521820.X | 申请日: | 2016-11-03 |
公开(公告)号: | CN109376114B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 陈云霁;杜子东;张磊;陈天石 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
主分类号: | G06F15/16 | 分类号: | G06F15/16 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | slam 运算 装置 方法 | ||
1.一种SLAM硬件加速器的运算装置,其特征在于,所述装置包括:
存储部分,用于存储输入数据、临时运算结果数据、最终运算结果数据、运算过程所需的指令集和/或算法参数数据,所述存储部分包括中间存储模块,所述存储部分用于根据需求不同,对具体的存储数据内容、存储组织方式和存取调用方式进行不同的规划;
运算部分,与所述存储部分连接,用于完成对SLAM相关算法和应用的计算,所述运算部分包括向量运算单元和标量运算单元;
所述中间存储模块,用于存储三维坐标的三个数值;
所述向量运算单元,用于通过配置指令从所述中间存储模块中提取操作数,以及对所述操作数执行平方运算,得到三个运算结果,所述操作数包括所述三维坐标的三个数值;
所述标量运算单元,用于对所述三个运算结果进行求和运算,然后执行开方运算,得到执行结果,以及将所述执行结果输出到中间结果存储模块或缓冲存储模块;
所述操作数还包括:DA、SA1、SA2、IX、IY、KX、KY,其中,所述DA为输出结果的存储地址,所述SA1为待运算的图像的起始地址,SA2为待运算的卷积核的起始地址,IX和IY分别表示图像X方向和Y方向上大小,KX和KY分别表示卷积核的大小。
2.根据权利要求1所述的装置,其特征在于,所述装置还包括:
缓冲存储模块,用于存储所述三个运算结果。
3.根据权利要求1或2所述的装置,其特征在于,所述向量运算单元包括三个基本运算模块,所述三维坐标的三个数值包括第一数值、第二数值和第三数值,所述在对所述操作数执行平方运算,得到三个运算结果方面,所述向量运算单元具体用于:
将所述第一数值、第二数值和第三数值分别输入到所述三个基本运算模块中的每个基本运算模块;
所述每个基本运算模块对输入的数值执行平方运算,得到三个运算结果。
4.根据权利要求1所述的运算装置,其特征在于,所述装置还包括:
输入存储模块:用于存储输入/输出数据;
中间结果存储模块:用于存储临时运算结果数据;
最终结果存储模块:用于存储最终运算结果数据;和/或
指令存储模块:用于存储运算过程所需的指令集。
5.根据权利要求4所述的运算装置,其特征在于,所述指令集包括:
控制操作指令类,用于选取待执行的运行指令的控制;
数据操作指令类,用于控制数据的传输;
宏运算指令类,用于完整的运算操作;
多维数据运算指令类,用于控制多维数据的运算操作;和/或
一维数据运算指令类,用于控制一维数据的运算操作。
6.根据权利要求5所述的运算装置,其特征在于,所述控制操作指令类包括指跳转指令和分支指令,跳转指令包括直接跳转指令和间接跳转指令,分支指令包括条件分支指令。
7.根据权利要求5所述的运算装置,其特征在于,所述数据操作指令类包括以下至少一种:
LD/ST指令,用于DRAM与SRAM中传输数据;
MOV指令,用于在SRAM之间传输数据;
RD/WR指令,表示用在于SRAM与BUFFER之间传输数据。
8.根据权利要求5所述的运算装置,所述宏运算指令类包括:卷积运算指令、卷积操作指令、图像累加操作指令、图像BOX滤波操作指令、局部极值操作指令、计数器比较操作指令和/或池化运算指令。
9.根据权利要求5所述的运算装置,所述宏运算指令类包括以下至少一种:
矩阵与矩阵乘法指令、矩阵与矩阵加法指令、矩阵与向量乘法指令、矩阵与向量加法指令、矩阵与标量乘法指令、矩阵与标量加法矩阵、向量与向量乘法指令和向量与向量外积指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811521820.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:SLAM运算装置和方法
- 下一篇:一种基于工作量证明的计算装置及计算方法