[发明专利]一种多通道无冲突拆分的硬件实现方法及运行该方法的计算机设备与可读存储介质有效
申请号: | 201911025671.2 | 申请日: | 2019-10-25 |
公开(公告)号: | CN111045965B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 李丽;邹文豪;傅玉祥;宋文清;何国强;陈铠;何书专 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F13/28 | 分类号: | G06F13/28;G06F5/16 |
代理公司: | 南京泰普专利代理事务所(普通合伙) 32360 | 代理人: | 窦贤宇 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通道 冲突 拆分 硬件 实现 方法 运行 计算机 设备 可读 存储 介质 | ||
1.一种基于可重构计算的多通道无冲突拆分的硬件实现方法,其特征是包括以下步骤:
步骤1、初始化,读取存储在寄存器中的多通道拆分相关配置信息,并将配置信息传输至DMA接口单元、数据重组单元和控制单元,包含通道数、采样点总数、当前批次采样点数以及单点位数;
步骤2、数据输入,DMA接口单元根据配置信息选择相应的源数据存储方式,将源数据从DDR传输至数据存储单元,传输结束后跳转至S3;
所述步骤2进一步包括以下六种情况:
情况1、源数据单点位数为64bit且通道数CH为奇数,源数据在Bank中按行连续存入;
情况2、源数据单点位数为64bit且通道数CH为偶数,将每1个采样点末尾补1个零,视为1个新采样点,当作情况1处理;
情况3、源数据单点位数为32bit且通道数CH为奇数,将每2个采样点为1组,视为1个新采样点,当作情况1处理;
情况4、源数据单点位数为32bit且通道数CH为偶数,将每2个采样点为1组,末尾补1个零,视为1个新采样点,当作情况1处理;
情况5、源数据单点位数为16bit且通道数CH为奇数,将每4个采样点为1组,视为1个新采样点,当作情况1处理;
情况6、源数据单点位数为16bit且通道数CH为偶数,将每4个采样点为1组,末尾补1个零,视为1个新采样点,当作情况1处理;
步骤3、调用无冲突访存单元根据控制单元提供的源数据分发方式,读取数据存储单元中相应源数据,存入数据存储单元相应位置;
所述无冲突访存单元通过地址映射将按采样点输入的源数据按通道存入数据存储单元,其并行路数受存储资源和单点位数影响,对于单点16bit的源数据,并行路数为4*N,对于单点32bit的源数据,并行路数为2*N,对于单点64bit的源数据,并行路数为N;对于单点位数为64bit的源数据进行1*N路的多通道拆分;对于单点位数为32bit的源数据进行2*N路的多通道拆分;对于单点位数为16bit的源数据进行4*N路的多通道拆分;
将源数据转换为源矩阵为;
对源矩阵C进行分块后得到分块矩阵;
在分块矩阵的基础上进行转置得到分块转置;
步骤4、遍历度判定,判断是否已经拆分完本批次的所有通道,未完成则返回S3,已完成则跳转至S5;
步骤5、数据重组,数据重组单元根据配置信息选择相应的数据重组模式;
步骤6、数据输出,DMA接口单元根据配置信息选择相应的结果数据读出方式,将结果数据从数据存储单元输出到DDR,结束算法。
2.根据权利要求1所述的基于可重构计算的多通道无冲突拆分的硬件实现方法,其特征在于,所述步骤5进一步包括以下三种情况:
情况1、源数据单点位数为64bit,每次取同一通道4个bank的数,组合成256bit输出;
情况2、源数据单点位数为32bit,每次取同一通道4个bank的数,按照AB交叉的方式组合成256bit输出;
情况3、源数据单点位数为16bit,每次取同一通道4个bank的数,按照ABCD交叉的方式组合成256bit输出。
3.根据权利要求1所述的基于可重构计算的多通道无冲突拆分的硬件实现方法,其特征在于:所述DMA接口单元用于DDR和SRAM之间的数据交互,根据配置信息选择相应的源数据无冲突存储方式和结果数据无冲突读出方式,以适应无冲突访存单元的要求。
4.根据权利要求1所述的基于可重构计算的多通道无冲突拆分的硬件实现方法,其特征在于:所述数据重组单元用于根据配置信息重组结果数据,发送至DMA接口单元进行结果输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911025671.2/1.html,转载请声明来源钻瓜专利网。