[发明专利]操作处理方法、装置、用于操作处理的装置及存储介质在审
申请号: | 202011530803.X | 申请日: | 2020-12-22 |
公开(公告)号: | CN112651489A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 张强;彭飞;李明星 | 申请(专利权)人: | 龙芯中科(合肥)技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06F9/30;G06F9/38 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 230088 安徽省合肥市高新*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 操作 处理 方法 装置 用于 存储 介质 | ||
本发明实施例提供了一种操作处理方法、装置、用于操作处理的装置以及存储介质,应用于卷积神经网络模型,其中的方法包括:从所述卷积神经网络模型的池化算子中提取待转换的循环结构;确定循环结构中参与循环计算的操作数;定义与所述操作数的数据类型相匹配向量数据,其中,每个向量数据包含预设个数的操作数;将所述循环结构中对所述操作数进行循环计算的循环体语句转换为对所述向量数据进行循环计算的单指令多数据流SIMD指令;执行转换后的循环结构,并且在至少一次的循环计算中,通过执行所述SIMD指令对所述预设个数的操作数并行进行循环计算。本发明实施例可以优化循环结构,减少循环次数,进而提高深度学习模型的性能。
技术领域
本发明涉及通信技术领域,特别是涉及一种操作处理方法、一种操作处理装置、一种用于操作处理的装置以及一种存储介质。
背景技术
深度学习是人工智能领域一个热门方向,广泛应用于搜索技术、图形图像处理、数据挖掘、机器学习、机器翻译、自然语言处理等各个领域。典型的深度学习模型有CNN(Convolutional Neural Networks,卷积神经网络)模型,主要应用于图形图像处理方面。
基于CNN的深度学习模型中通常大量使用循环结构,在循环次数较大的情况下,不仅循环次数较多,导致循环操作较为耗时,而且大量的循环计算需要多次进行内存访问,严重影响深度学习模型的性能。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种操作处理方法,以优化卷积神经网络模型中的循环结构,减少循环次数,进而提高深度学习模型的性能。
相应的,本发明实施例还提供了一种操作处理装置、一种用于操作处理的装置以及一种存储介质,用以保证上述方法的实现及应用。
为了解决上述问题,本发明实施例公开了一种操作处理方法,应用于卷积神经网络模型,所述方法包括:
从所述卷积神经网络模型的池化算子中提取待转换的循环结构;
确定循环结构中参与循环计算的操作数;
定义与所述操作数的数据类型相匹配向量数据,其中,每个向量数据包含预设个数的操作数;
将所述循环结构中对所述操作数进行循环计算的循环体语句转换为对所述向量数据进行循环计算的单指令多数据流SIMD指令;
执行转换后的循环结构,并且在至少一次的循环计算中,通过执行所述SIMD指令对所述预设个数的操作数并行进行循环计算。
本发明实施例还公开了一种内存访问的装置,应用于卷积神经网络模型,所述装置包括:
结构确定模块,用于从所述卷积神经网络模型的池化算子中提取待转换的循环结构;
数据确定模块,用于确定循环结构中参与循环计算的操作数;
向量定义模块,用于定义与所述操作数的数据类型相匹配向量数据,其中,每个向量数据包含预设个数的操作数;
指令转换模块,用于将所述循环结构中对所述操作数进行循环计算的循环体语句转换为对所述向量数据进行循环计算的单指令多数据流SIMD指令;
指令执行模块,用于执行转换后的循环结构,并且在至少一次的循环计算中,通过执行所述SIMD指令对所述预设个数的操作数并行进行循环计算。
本发明实施例还公开了一种用于操作处理的装置,应用于卷积神经网络模型,所述装置包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
从所述卷积神经网络模型的池化算子中提取待转换的循环结构;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于龙芯中科(合肥)技术有限公司,未经龙芯中科(合肥)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011530803.X/2.html,转载请声明来源钻瓜专利网。