[发明专利]一种深度学习模型的运行方法、装置、电子设备及介质在审
申请号: | 202010265726.3 | 申请日: | 2020-04-07 |
公开(公告)号: | CN111860758A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 靖远 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F17/12 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 裴素英 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 学习 模型 运行 方法 装置 电子设备 介质 | ||
1.一种深度学习模型的运行方法,其特征在于,包括:
获取深度学习模型中各个算子之间的逻辑关系;
根据各个算子之间的逻辑关系,调整所述深度学习模型中各个算子的运行时间,以使所述调整后的深度学习模型中,至少两个逻辑关系相连续的算子的运行总时长被延长;
按照所述调整后的所述深度学习模型中各个算子的运行时间,运行所述深度学习模型。
2.根据权利要求1所述的方法,其特征在于,根据各个算子之间的逻辑关系,调整所述深度学习模型中各个算子的运行时间,以使所述调整后的深度学习模型中,至少两个逻辑关系相连续的算子的运行总时长被延长,包括:
针对至少一个目标算子对,在该目标算子对中的两个算子之间设置预定的延迟时间,以使该目标算子对的运行总时长被延长;所述目标算子对中的两个算子是逻辑关系相连续的两个算子,所述延迟时间用于表征目标算子对中的两个算子的执行间隔时间。
3.根据权利要求2所述的方法,其特征在于,通过以下步骤确定所述目标算子对中的两个算子的延迟时间:
针对所述目标算子对,根据该目标算子对中的前一个算子的计算量确定该目标算子对中的两个算子的延迟时间。
4.根据权利要求3所述的方法,其特征在于,通过以下步骤确定每个算子的计算量,包括:
针对每个算子,获取该算子在运行时所需的计算参数;所述计算参数包括以下的任意一种或多种:调用的计算单元数量、计算单元的调用次数;
基于每个算子在运行时所需的计算参数,确定该算子的计算量。
5.根据权利要求2所述的方法,其特征在于,任意所述目标算子对中的两个算子的延迟时间均是相同的。
6.根据权利要求2所述的方法,其特征在于,通过以下步骤确定所述目标算子对中的两个算子的延迟时间:
以所述深度学习模型中所有目标算子对的延迟时间变量的累加值不大于预设的总延迟时间,且每个目标算子对的延迟时间变量的平均值最大为约束条件,求解每个目标算子对的延迟时间变量的值;
基于求解的所述目标算子对的延迟时间变量的值,确定所述目标算子对中的两个算子的延迟时间。
7.根据权利要求6所述的方法,其特征在于,通过以下步骤确定所述深度学习模型中所有目标算子对的延迟时间变量的累加值:
针对所述深度学习模型并行运行的情况,若多个目标算子对中的后一个算子均为同一算子,则所述多个目标算子对的延迟时间变量的累加值为所述多个目标算子对的延迟时间变量的值中的最大值。
8.根据权利要求6所述的方法,其特征在于,通过以下步骤确定所述深度学习模型中所有目标算子对的延迟时间变量的累加值:
针对所述深度学习模型串行运行的情况,若多个目标算子对中的后一个算子均为同一算子,则所述多个目标算子对的延迟时间变量的累加值为所述多个目标算子对的延迟时间变量的值的累加值。
9.根据权利要求1所述的方法,其特征在于,获取深度学习模型中各个算子之间的逻辑关系,包括:
利用模型解析工具对所述深度学习模型进行模型解析,得到模型数据流图;
从所述模型数据流图中获取所述深度学习模型中各个算子之间的逻辑关系。
10.一种深度学习模型的运行装置,其特征在于,包括:
获取模块,用于获取深度学习模型中各个算子之间的逻辑关系;
调整模块,用于根据各个算子之间的逻辑关系,调整所述深度学习模型中各个算子的运行时间,以使所述调整后的深度学习模型中,至少两个逻辑关系相连续的算子的运行总时长被延长;
运行模块,用于按照所述调整后的所述深度学习模型中各个算子的运行时间,运行所述深度学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010265726.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音识别方法、装置、电子设备及存储介质
- 下一篇:增量式模拟数字转换器