[发明专利]运算方法、装置及相关产品有效
申请号: | 201811634980.5 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109711367B | 公开(公告)日: | 2020-03-06 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100190 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 运算 方法 装置 相关 产品 | ||
本公开涉及一种运算方法、装置及相关产品,所述产品包括控制模块,所述控制模块包括:指令缓存单元、指令处理单元和存储队列单元;所述指令缓存单元,用于存储所述人工神经网络运算关联的计算指令;所述指令处理单元,用于对所述计算指令解析得到多个运算指令;所述存储队列单元,用于存储指令队列,该指令队列包括:按该队列的前后顺序待执行的多个运算指令或计算指令。通过以上方法,本公开可以提高相关产品在进行神经网络模型的运算时的运算效率。
技术领域
本公开涉及人工智能技术领域,尤其涉及一种运算方法、装置及相关产品。
背景技术
在人工智能技术领域,深度学习技术目前在图像、视频处理领域已有较为广泛的应用,基于特定的数据集训练完成的神经网络,可以在分类和检测任务中达到较高的准确率。但是,由于受限于训练过程中使用的数据集和预处理工具,训练完成的神经网络通常仅能用在与训练集类型相同/数据格式一致的应用环境下,其可复用性不高。如果需要使用不同类型的输入数据,通常要进行重训练,或对输入数据进行预处理,使得数据处理效率较低。
发明内容
有鉴于此,本公开提出了一种运算方法,通过根据第一格式和第二格式,对Caffe图像处理模型的模型定义文件中首层卷积层的卷积核进行处理,得到调整后的模型定义文件,以使根据调整后的模型定义文件生成的Caffe图像处理模型所支持的输入数据格式为待处理任务的输入图像的数据格式,有效提高了Caffe图像处理模型的匹配度和复用性。
根据本公开的一方面,提供了一种运算方法,其特征在于,所述方法应用于异构计算架构中,所述异构计算架构包括通用处理器和人工智能处理器,包括:
在接收到待处理任务时,判断所述待处理任务的输入图像数据的第一格式与预设的Caffe图像处理模型所支持的输入数据的第二格式是否一致;
在所述第一格式与所述第二格式不一致时,根据所述第一格式及所述第二格式,对所述Caffe图像处理模型的模型定义文件中的卷积核进行处理,得到调整后的模型定义文件,以使根据所述调整后的模型定义文件生成的Caffe 图像处理模型所支持的输入图像数据为所述第一格式;
其中,所述卷积核为所述Caffe图像处理模型的首层卷积层对应的卷积核。
在一种可能的实现方式中,所述第一格式为单通道数据格式,所述第二格式为多通道数据格式;
其中,根据所述第一格式及所述第二格式,对所述Caffe图像处理模型的模型定义文件中的卷积核进行处理,包括:
按照第一运算逻辑对所述模型定义文件中的卷积核进行通道合并,得到合并后的卷积核;
其中,所述合并后卷积核的通道与所述第一格式的通道相匹配。
在一种可能的实现方式中,所述第一格式包括灰度图像格式或明度图像格式,所述第二格式包括三基色图像格式;
所述第一运算逻辑为加权求和运算;
其中,按照第一运算逻辑对所述模型定义文件中的卷积核进行通道合并,包括:
根据所述第一格式和所述第二格式,将所述卷积核各个通道相同位置处的权重值乘以相应的系数后,再对乘以系数后的每个值进行求和运算,得到所述合并后的卷积核。
在一种可能的实现方式中,所述第一格式为多通道数据格式,所述第二格式为单通道数据格式;
其中,根据所述第一格式及所述第二格式,对所述Caffe图像处理模型的模型定义文件中的卷积核进行处理,包括:
按照第二运算逻辑对所述模型定义文件中的卷积核进行通道拆分,得到拆分后的卷积核;
其中,所述拆分后的卷积核的通道与所述第一格式的通道相匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811634980.5/2.html,转载请声明来源钻瓜专利网。