[发明专利]一种卷积神经网络的加速方法、装置、设备及存储介质在审
申请号: | 201910016345.9 | 申请日: | 2019-01-08 |
公开(公告)号: | CN109858610A | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 王丽;曹芳;郭振华 | 申请(专利权)人: | 广东浪潮大数据研究有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 510620 广东省广州市天河区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算操作 动作时序 卷积神经网络 存储介质 内核程序 预设 现场可编程门阵列FPGA 加速操作 预设数据 研发 编译 运算 开发 | ||
本发明公开了一种卷积神经网络的加速方法装置、设备以及存储介质,包括预先接收预设的卷积神经网络CNN中的多个预设类型的计算操作模型;从多个计算操作模型中,获取能够实现待加速CNN的各个计算操作的计算操作模型,作为待用计算操作模型;控制加速卡的现场可编程门阵列FPGA根据待用计算操作模型,编译出用于执行待加速CNN的内核程序;获取包含待加速CNN的各个计算操作的动作时序的动作时序参数;控制FPGA按照动作时序参数中的动作时序执行内核程序,并对预设数据进行运算,以便实现加速。本发明采用任何一块加速卡均可以执行对任何一个待加速CNN的加速操作,无需开发出多种加速卡,灵活性较强,且节省了研发成本。
技术领域
本发明涉及算法加速领域,特别是涉及一种卷积神经网络的加速方法,本发明还涉及一种卷积神经网络的加速装置、设备及存储介质。
背景技术
CNN(Convolutional Neutral Network,卷积神经网络)是人工神经网络的一种,为了满足运算速度等要求,通常会使用加速卡对CNN的运算过程进行加速,但是CNN有多种不同的类型,现有技术中在对CNN的运算过程进行加速时,必须使用待加速的该种类型的CNN专用的加速卡,即每种类型的CNN都需要专用的加速卡才能够实现加速,灵活性较差,且研发多种类型的加速卡产生了较高的研发成本。
因此,如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。
发明内容
本发明的目的是提供一种卷积神经网络的加速方法,灵活性较强,且节省了研发成本;本发明的另一目的是提供一种卷积神经网络的加速装置、设备及存储介质,灵活性较强,且节省了研发成本。
为解决上述技术问题,本发明提供了一种卷积神经网络的加速方法,包括:
预先接收预设的卷积神经网络CNN中的多个预设类型的计算操作模型;
从多个所述计算操作模型中,获取能够实现待加速CNN的各个计算操作的所述计算操作模型,作为待用计算操作模型;
控制加速卡的现场可编程门阵列FPGA根据所述待用计算操作模型,编译出用于执行所述待加速CNN的内核程序;
获取包含所述待加速CNN的各个所述计算操作的动作时序的动作时序参数;
控制所述FPGA按照所述动作时序参数中的所述动作时序执行所述内核程序,并对预设数据进行运算,以便实现加速。
优选地,所述获取包含所述待加速CNN的各个所述计算操作的动作时序的动作时序参数具体为:
将所述待加速CNN转换为预设深度学习框架的所述待加速CNN;
获取包含预设深度学习框架的所述待加速CNN的各个所述计算操作的动作时序的动作时序参数。
优选地,所述预设深度学习框架为caffe或TensorFlow。
优选地,所述控制加速卡的现场可编程门阵列FPGA根据所述待用计算操作模型,编译出用于执行所述待加速CNN的内核程序具体为:
控制加速卡的现场可编程门阵列FPGA根据所述待用计算操作模型,通过自身的硬件编译平台,编译出用于执行所述待加速CNN的内核程序。
优选地,所述预先接收预设的卷积神经网络CNN中的多个预设类型的计算操作模型具体为:
预先接收利用开放运算语言OpenCL预设的卷积神经网络CNN中的多个预设类型的计算操作模型。
优选地,所述预设类型包括卷积操作、池化操作、线性整流函数Relu以及Norm函数。
为解决上述技术问题,本发明还提供了一种卷积神经网络的加速装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东浪潮大数据研究有限公司,未经广东浪潮大数据研究有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910016345.9/2.html,转载请声明来源钻瓜专利网。