[发明专利]提升深度学习模型吞吐量的方法、装置、设备及可读介质在审
申请号: | 202111274301.X | 申请日: | 2021-10-29 |
公开(公告)号: | CN114139679A | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 辛永欣 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 张涛;杨帆 |
地址: | 215000 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提升 深度 学习 模型 吞吐量 方法 装置 设备 可读 介质 | ||
1.一种提升深度学习模型吞吐量的方法,其特征在于,包括以下步骤:
根据需求为深度学习模型设置分层界限阈值;
获取所述深度模型中网络结构的层数,并将所述深度学习模型根据分层界限阈值划分为两部分;
按两部分模型的顺序依次对输入参数进行训练。
2.根据权利要求1所述的方法,其特征在于,获取所述深度模型中网络结构的层数,并将所述深度学习模型根据分层界限阈值划分为两部分包括:
获取所述深度模型中网络结构的层数;
将第一层网络结构到所述分层界限阈值对应的网络结构划分为第一部分模型;
将所述分层界限阈值对应的网络结构到最后一层网络结构划分为第二部分模型。
3.根据权利要求1所述的方法,其特征在于,分层界限阈值为1至所述深度学习模型中网络结构层数之间的整数。
4.根据权利要求1所述的方法,其特征在于,按两部分模型的顺序依次对输入参数进行训练包括:
使用第一部分模型对输入参数进行训练后得到训练结果;
使用第二部分模型对所述训练结果进行训练后得到最终结果。
5.一种提升深度学习模型吞吐量的装置,其特征在于,所述装置包括:
设置模块,所述设置模块配置为根据需求为深度学习模型设置分层界限阈值;
划分模块,所述划分模块配置为获取所述深度模型中网络结构的层数,并将所述深度学习模型根据分层界限阈值划分为两部分;
训练模块,所述训练模块配置为按两部分模型的顺序依次对输入参数进行训练。
6.根据权利要求5所述的装置,其特征在于,所述划分模块还配置为:
获取所述深度模型中网络结构的层数;
将第一层网络结构到所述分层界限阈值对应的网络结构划分为第一部分模型;
将所述分层界限阈值对应的网络结构到最后一层网络结构划分为第二部分模型。
7.根据权利要求5所述的装置,其特征在于,分层界限阈值为1至所述深度学习模型中网络结构层数之间的整数。
8.根据权利要求5所述的装置,其特征在于,所述训练模块还配置为:
使用第一部分模型对输入参数进行训练后得到训练结果;
使用第二部分模型对所述训练结果进行训练后得到最终结果。
9.一种计算机设备,其特征在于,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现权利要求1-4任意一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-4任意一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111274301.X/1.html,转载请声明来源钻瓜专利网。