[发明专利]基于single‑portSRAM的转置矩阵的地址映射算法有效
申请号: | 201410499728.3 | 申请日: | 2014-09-25 |
公开(公告)号: | CN104270643B | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 范益波;谢峥;程魏;曾晓洋 | 申请(专利权)人: | 复旦大学 |
主分类号: | H04N19/625 | 分类号: | H04N19/625;H04N19/122;H04N19/13 |
代理公司: | 上海正旦专利代理有限公司31200 | 代理人: | 陆飞,盛志范 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 single port sram 矩阵 地址 映射 算法 | ||
1.一种基于Single-port SRAM的转置矩阵的地址映射算法,基于矩阵分块求转置的基本运算:设对NxN矩阵A,求矩阵A的转置矩阵的步骤如下:
①把NxN矩阵划分为以MxM矩阵为基本单元的(N/M)x(N/M)块矩阵;
②对(N/M)x(N/M)的块矩阵求转置;
③对每个MxM矩阵求转置;
其中,Ahk为MxM基本单元矩阵,h,k=0,1,2,3;
基于Single-port SRAM的转置矩阵硬件结构,由如下三部分模块组成:AGM,SRAM,MAM;其中:(1)SRAM模块,是存储单元,划分为32个Bank,每个Bank的深度为5,位宽为16bit;(2)AGM模块,根据映射算法产生地址add(i)和地址badd(i),数据的映射通过地址add(i)和地址badd(i)确定,i=0,1,2…,31;add(i)是第i个Bank的输入信号,控制将数据写入第i个Bank的指定字节;badd(i)通过MAM模块对数据进行排序:写操作时通过对输入数据排序将输入数据分块并写入指定的Bank;读操作时通过对读出的数据排序实现对块矩阵的转置及正序输出;(3)MAM模块,由32个32:1的选择器MUX组成,控制信号为badd(i),对数据进行排序;
所述地址映射算法,通过add(i)和badd(i)确定,具体映射如下:
①4x4输入矩阵:算法支持同时处理两个4x4输入矩阵,4x4矩阵的转置直接通过badd实现,不经过SRAM的存储;
映射如下:
②8x8输入矩阵:8x8输入矩阵每次输入连续4行或4列,共输入两次:k=0,1;
写操作时地址映射如下:
读操作时地址映射如下:
③16x16输入矩阵:16x16输入矩阵每次输入连续2行或2列,共输入8次:k=0,1,2,...,7;写操作时地址映射如下:
读操作时地址映射如下:
④32x32输入矩阵:32x32输入矩阵每次输入1行或1列,共输入32次:k=0,1,2,...,31;写操作时地址映射如下:
其中:
⑴%:取余数的操作;M%N表示M除N的余数;
⑵/:取整操作;M/N表示M除N的商的整数部分;
⑶fN(i,j)是一个NxN的二维矩阵;
f8如下所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410499728.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种媒体内容推荐方法和装置
- 下一篇:图像解码装置以及图像解码方法