[发明专利]数据处理方法、相关设备及计算机可读介质在审
申请号: | 202010521841.2 | 申请日: | 2020-06-09 |
公开(公告)号: | CN111767243A | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海寒武纪信息科技有限公司 |
主分类号: | G06F15/17 | 分类号: | G06F15/17;G06F17/15;G06F9/50 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
地址: | 201306 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 相关 设备 计算机 可读 介质 | ||
本发明实施例公开了一种计算设备,包括:包括处理器、存储器以及总线,所述处理器和所述存储器通过所述总线连接,所述存储器用于存储指令,所述处理器用于调用所述存储器中存储的指令,用于执行特定的数据处理方法,以提升数据处理性能和效率。
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据处理方法、相关设备及计算机可读介质。
背景技术
卷积(convolution,conv)运算是权值(weight)和输入数据(input)的乘法累加计算。处理器通过重复计算权值与输入数据的乘积,并做累加计算得到。由于处理器的寄存器资源有限,在卷积运算过程中需不断重复加载权值和输入数据,这将带来大量的输入输出(input output,IO)访存量、导致出现IO瓶颈、影响处理器的计算效率。
发明内容
本发明实施例提供一种数据处理方法,能够解决现有技术中存在的IO访存量较大、出现IO瓶颈、影响计算效率等问题。
第一方面,本发明实施例提供了一种数据处理方法,该方法包括:
获取卷积数据块;
将所述卷积数据块分配至所述m个处理核,得到所述m个处理核的卷积权值,所述卷积权值属于所述卷积数据块的一部分,m为正整数;
在整个图像数据块的深度方向移动卷积数据块,确定所述m个处理核的输入数据,每个处理核的图像数据块与对应的卷积权值进行卷积运算,以调用所述m个处理核实现所述图像数据块与所述卷积数据块的卷积运算,得到卷积结果块。
第二方面,本发明实施例提供了一种计算装置,该装置包括用于执行上述第一方面的方法的单元或模块。
第三方面,本发明实施例提供了一种计算芯片,该计算芯片中部署有包含m个处理核的计算簇cluster,该计算芯片用于执行如上第一方面的方法。
第四方面,本发明实施例提供了另一种计算设备,包括处理器、存储器以及总线,所述处理器和所述存储器通过所述总线连接,所述存储器用于存储指令,所述处理器用于调用所述存储器中存储的指令,用于执行上述第一方面的方法。
第五方面,本发明实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。
通过实施本发明实施例,能够将卷积数据块预先分配至m个处理核中,进而通过移动图像数据块与m个处理核的卷积权值进行卷积运算,以实现图像数据块和卷积数据块之间的卷积运算。这样能够解决现有技术中存在的IO访存量较大、出现IO瓶颈、影响计算效率等问题。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种计算芯片的结构示意图。
图2是本发明实施例提供的一种数据处理方法的流程示意图。
图3是本发明实施例提供的一种卷积数据块的拆分示意图。
图4是本发明实施例提供的一种卷积数据块加载的示意图。
图5是本发明实施例提供的一种图像数据块与卷积结果块运算的映射关系示意图。
图6~图13是本发明实施例提供的几种处理核中实现卷积运算的具体示意图。
图14是本发明实施例提供的一种计算装置的结构示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海寒武纪信息科技有限公司,未经上海寒武纪信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010521841.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种加速光伏组件粘接胶固化的装置
- 下一篇:一种污水旋流沉降处理装置