[发明专利]一种面向向量处理器的池化向量化实现方法有效
申请号: | 202111178180.9 | 申请日: | 2021-10-09 |
公开(公告)号: | CN113806261B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 王庆林;梅松竹;苏华友;李东升;姜晶菲;许金伟;李荣春;乔鹏;刘杰 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F13/28 | 分类号: | G06F13/28;G06F15/80 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张乐 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 向量 处理器 量化 实现 方法 | ||
1.一种面向向量处理器的池化向量化实现方法,其特征在于,包括如下步骤:
S1.根据AM空间参数、池化窗口预设参数,获取输入分块特征图每次传入AM空间的传输分块参数;
S2.基于DMA操作将所述输入分块特征图的子块加载至所述AM空间;
S3.根据预设规则将单个所述输入分块特征图的子块进行分区;
S4.根据预设顺序依次对所述输入分块特征图的子块的每个区域进行池化处理;
S5.基于DMA操作将处理后获得的输出分块特征图的子块从所述AM空间中导出至存储器中;
S6.重复步骤S1-S5直至获取所有所述输出分块特征图的子块的池化结果;
所述步骤S3具体为:
对单个所述输入分块特征图的子块,按照填充情况分为上、中、下、左、右共五个区;
所述步骤S4的预设顺序具体为:上、下、左、右、中;
所述步骤S4包括:
A1.获取当前所在区的池化窗口非填充向量个数;
A2.初始化向量寄存器V0与i=0;
A3.从当前池化窗口中加载第i个L长的数据到向量寄存器V1中,其中L具体为向量处理器单元并行处理的数据宽度;
A4.根据池化模式选取预设计算规则,获取池化结果,并将池化结果存储在所述向量寄存器V0中;
A5.递增i,若i<非填充向量个数则返回步骤A3;
A6.根据所述池化模式处理所述向量寄存器V0中的每个元素,并将处理结果存储在所述向量寄存器V0中;
A7.存储所述向量寄存器V0至所述AM空间中;
其中,所述池化模式具体为:平均值池化与最大值池化。
2.如权利要求1所述的面向向量处理器的池化向量化实现方法,其特征在于,所述AM空间参数具体为AM空间大小;
所述池化窗口预设参数具体为:池化窗口高度、宽度、水平移动步长和垂直移动步长;
所述输入分块特征图每次传入AM空间的传输分块参数具体为:所述输入分块特征图的子块的高度和所述输入分块特征图的子块的宽度。
3.如权利要求2所述的面向向量处理器的池化向量化实现方法,其特征在于,单个所述输入分块特征图子块具体表示为如下公式:
;
其中,为输入分块特征图的子块的高度,为输入分块特征图的子块的宽度,为向量处理器向量单元并行处理的数据宽度。
4.如权利要求1所述的面向向量处理器的池化向量化实现方法,其特征在于,所述步骤A1还包括:若所述当前所在区为上区或下区,则获取第一个池化窗口的非填充向量个数与最后一个池化窗口的非填充向量个数。
5.如权利要求1所述的面向向量处理器的池化向量化实现方法,其特征在于,所述步骤A4中根据池化模式选取预设计算规则,获取池化结果具体为:
若所述池化模式为平均值池化,则获取所述向量寄存器V0与所述向量寄存器V1之和;
若所述池化模式为最大值池化,则获取所述向量寄存器V0与所述向量寄存器V1中分别对应的元素最大值。
6.如权利要求5所述的面向向量处理器的池化向量化实现方法,其特征在于,所述步骤A6中根据所述池化模式,处理所述向量寄存器V0中的每个元素具体为:若所述池化模式为平均值池化,则获取所述向量寄存器V0中的每个元素与所述池化窗口宽度、高度的乘积之间的商值;若所述池化模式为最大值池化,则跳过处理步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111178180.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可以方便拆装钻具的数控钻孔攻牙机
- 下一篇:一种业务处理方法及系统