[发明专利]卷积神经网络的存储器优化的区块式推论方法及其系统在审
申请号: | 202010922472.8 | 申请日: | 2020-09-04 |
公开(公告)号: | CN112633462A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 黄朝宗 | 申请(专利权)人: | 黄朝宗 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06T1/60 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 聂慧荃;闫华 |
地址: | 中国台湾新*** | 国省代码: | 台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 神经网络 存储器 优化 区块 推论 方法 及其 系统 | ||
1.一种卷积神经网络的存储器优化的区块式推论方法,用以处理一输入影像,其特征在于,该卷积神经网络的存储器优化的区块式推论方法包含以下步骤:
一参数设定步骤,是设定一推论参数组,该推论参数组包含一卷积深度、一区块宽度、一区块高度及多层卷积核大小;
一分割步骤,是驱动一运算处理单元依据该卷积深度、该区块宽度、该区块高度及所述多层卷积核大小划分该输入影像成多个输入区块数据,各该输入区块数据具有一输入区块大小;
一区块推论步骤,是驱动该运算处理单元将各该输入区块数据执行一多层卷积操作而产生一输出区块数据,且该多层卷积操作包含:
一第一方向数据选取步骤,是依据该输出区块数据的一位置沿一扫描换行方向选择多个第i层重新计算特征,然后依据该输出区块数据的该位置及所述多个第i层重新计算特征选取出一第i层重新计算输入特征区块数据,其中i为1至该卷积深度的多个正整数的其中一者;
一第二方向数据选取步骤,是依据该第i层重新计算输入特征区块数据沿一区块扫描方向选取出多个第i层重复利用特征,并将该第i层重新计算输入特征区块数据及所述多个第i层重复利用特征组合而产生一第i层重复利用输入特征区块数据;及
一卷积运算步骤,是依据一第i层卷积核大小从该第i层重复利用输入特征区块数据中选取出多个第i层子区块输入特征群,然后对各该第i层子区块输入特征群及一卷积参数组执行一卷积运算而产生一第i层子区块输出特征,并将对应所述多个第i层子区块输入特征群的所述多个第i层子区块输出特征组合而形成一第i层输出特征区块数据;以及
一暂存步骤,是驱动一区块暂存器暂存该第i层输出特征区块数据及所述多个第i层重复利用特征。
2.如权利要求1所述的卷积神经网络的存储器优化的区块式推论方法,其特征在于,
当i等于1时,该第i层重新计算输入特征区块数据等于各该输入区块数据;及
当i等于该卷积深度时,该第i层输出特征区块数据等于该输出区块数据。
3.如权利要求1所述的卷积神经网络的存储器优化的区块式推论方法,其特征在于,该第i层重新计算输入特征区块数据具有一第i层重新计算输入特征区块大小与一第i层重新计算输入特征区块通道数,该第i层输出特征区块数据具有一第i层输出特征区块大小与一第i层输出特征区块通道数,该第i层输出特征区块大小大于该第i层重新计算输入特征区块大小,且该第i层重新计算输入特征区块通道数等于该第i层输出特征区块通道数。
4.如权利要求1所述的卷积神经网络的存储器优化的区块式推论方法,其特征在于,该区块扫描方向垂直于该扫描换行方向,该区块宽度大于该区块高度,且该区块高度的一延伸方向平行于该区块扫描方向。
5.如权利要求1所述的卷积神经网络的存储器优化的区块式推论方法,其特征在于,该卷积深度、该区块宽度及该区块高度均为正整数,该第i层卷积核大小为kWi×kHi,所述多个第i层重复利用特征沿该区块扫描方向具有一重复利用特征数量,且该重复利用特征数量等于kHi-1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黄朝宗,未经黄朝宗许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010922472.8/1.html,转载请声明来源钻瓜专利网。