[发明专利]运算装置、运算执行设备及运算执行方法有效
申请号: | 201810151426.5 | 申请日: | 2018-02-13 |
公开(公告)号: | CN108364061B | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 周舒畅;胡晨;梁喆 | 申请(专利权)人: | 北京旷视科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 安卫静 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 运算 装置 执行 设备 方法 | ||
本发明提供了一种运算装置、运算执行设备及运算执行方法,该运算执行设备包括:控制器、存储器和运算装置;存储器用于存储预先设置的单指令集合;单指令集合包括运算装置进行多层运算时,每层运算对应的单指令;每条单指令包括模块选择参数和模块运行参数;控制器用于从存储器中读取运算装置所需的当前层运算对应的当前单指令,对当前单指令包括的模块选择参数和模块运行参数进行解析,确定当前单指令对应的运算通路;运算装置用于在控制器的控制下连通当前单指令对应的运算通路,利用当前单指令对应的运算通路对运算装置在当前层运算中的输入数据进行运算处理,生成当前层运算的输出数据。本发明能够有效提升用于实现神经网络的硬件资源利用率。
技术领域
本发明涉及人工智能技术领域,尤其是涉及一种运算装置、运算执行设备及运算执行方法。
背景技术
在诸如图像识别、语音识别以及文字识别等领域中,神经网络凭借着其强大的计算能力已得到广泛应用,在诸如抓拍机、人脸识别器等图像处理设备中均应用神经网络对图像进行处理。
在将神经网络应用于产品时,神经网络的运行需要借助诸如FPGA(FieldProgrammable Gate Array,现场可编程门阵列)、ASIC(Application SpecificIntegrated Circuit,专用集成电路)等硬件实现。由于神经网络需要涉及到诸如卷积、池化、全连接等多个运算层,每个运算层对应相同或不同的计算逻辑下的网络结构;不同的网络结构均需要对应设计不同的硬件结构,这种对神经网络的实现方式极易造成硬件资源的浪费。
发明内容
有鉴于此,本发明的目的在于提供一种运算装置、运算执行设备及运算执行方法,能够改善现有技术中实现神经网络的硬件资源容易浪费的技术问题,可有效提升硬件资源利用率。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种运算装置,所述运算装置用于实现复用神经网络架构,所述运算装置包括多种功能运算模块,所述功能运算模块包括以下至少之一:拼接模块、扩充模块、卷积模块和量化模块;多种所述功能运算模块通过组合可连通形成多条运算通路;其中,每条所述运算通路用于实现一种计算逻辑;所述计算逻辑包括以下至少之一:卷积操作、反卷积操作、池化操作、量化操作和全连接操作。
进一步,每种所述功能运算模块对应一种或多种运算类型;其中,所述运算类型包括拼接运算、扩充运算、卷积运算、池化运算、量化运算、非线性运算或全连接运算。
进一步,所有的所述运算通路均至少包括所述拼接模块和所述卷积模块。
进一步,在第一运算通路中还包括所述扩充模块,所述卷积模块接在所述扩充模块之后,以实现反卷积操作。
进一步,在第二运算通路中,所述卷积模块包括卷积核大小为1*1的卷积层,以实现全连接操作。
进一步,在第三运算通路中还包括量化模块,且所述量化模块设置于所述第三运算通路的末端,以实现量化操作。
进一步,在第四运算通路中仅包括所述拼接模块和所述卷积模块,以实现卷积操作。
进一步,所述卷积模块包括带跨度的卷积层;当所述卷积层的跨度为1时,所述卷积模块用于实现卷积运算,当所述卷积层的跨度不为1时,所述卷积模块用于实现卷积运算和池化运算。
进一步,所述量化模块通过将浮点数值量化为低位的比特值的方式实现参数压缩和非线性运算。
进一步,所述功能运算模块还包括反卷积模块、池化模块或全连接模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司,未经北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810151426.5/2.html,转载请声明来源钻瓜专利网。