[发明专利]构建深度学习的网络模型的方法、装置、设备和存储介质有效
申请号: | 202011249391.2 | 申请日: | 2020-11-10 |
公开(公告)号: | CN112270403B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 王海峰;胡晓光;刘红雨;于佃海;马艳军;吴甜 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 赵林琳 |
地址: | 100094 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 深度 学习 网络 模型 方法 装置 设备 存储 介质 | ||
1.一种构建深度学习的网络模型的方法,包括:
基于模式参数,确定用于执行代码的执行模式;
如果确定所述执行模式为第一执行模式,通过所述代码中的语法元素,使用能够在所述第一执行模式中使用的第一组件以执行所述代码;以及
如果确定所述执行模式为第二执行模式,通过所述语法元素,使用能够在所述第二执行模式中使用的第二组件以执行所述代码,而不对所述代码进行转换;
其中,当所述语法元素中包括用于启用所述第二执行模式的语法元素时,则更新所述模式参数,以启用所述第二执行模式;以及当所述语法元素中包括用于禁用所述第二执行模式的语法元素时,则更新所述模式参数,以启用所述第一执行模式;
其中所述第一组件和所述第二组件具有相同的组件接口,所述语法元素对应于所述组件接口。
2.根据权利要求1所述的方法,其中所述组件接口包括控制流组件接口,
所述方法还包括:当对应于所述控制流组件接口的语法元素被执行时:
在所述第一执行模式中,使用所述第一组件中的第一控制流组件;以及
在所述第二执行模式中,使用所述第二组件中的第二控制流组件。
3.根据权利要求2所述的方法,其中所述组件接口包括网络构建组件接口,
所述方法还包括:当对应于所述网络构建组件的语法元素被执行时:
在所述第一执行模式中,通过所述第一控制流组件来使用网络构建组件;以及
在所述第二执行模式中,通过所述第二控制流组件来使用所述网络构建组件。
4.根据权利要求1所述的方法,其中所述组件接口包括网络执行组件接口,
所述方法还包括:当对应于所述网络执行组件接口的语法元素被执行时:
在所述第一执行模式中,使用所述第一组件中的第一网络执行组件对输入数据进行处理以获取输出数据;以及
在所述第二执行模式中,使用所述第二组件中的第二网络执行组件对输入数据进行处理以获取输出数据。
5.根据权利要求4所述的方法,还包括:所述第二组件中的第二网络执行组件被执行时:
基于所述输入数据,确定针对所述输入数据的第一计算图;以及
基于所述第一计算图,对所述输入数据进行处理以获取所述输出数据。
6.根据权利要求1所述的方法,其中,所述第一执行模式包括动态图模式,所述第二执行模式包括静态图模式。
7.根据权利要求6所述的方法,其中所述组件接口包括网络优化组件接口,
所述方法还包括:当对应于所述网络优化组件接口的语法元素被执行时:
在所述第一执行模式中,使用所述第一组件中的第一网络优化组件对网络模型参数进行更新;以及
在所述第二执行模式中,使用所述第二组件中的第二网络优化组件对网络模型参数进行更新。
8.根据权利要求7所述的方法,还包括:所述第二网络优化组件被执行时:
构建针对前向传播的第二计算图,以确定所述网络模型参数所引起的损失;
构建针对反向传播的第三计算图,以确定与所述网络模型参数相关的梯度;以及
构建针对网络模型参数更新的第四计算图,以确定更新的网络模型参数。
9.根据权利要求1所述的方法,其中所述组件接口包括学习率调整组件接口,
所述方法还包括:当对应于所述学习率调整组件接口的语法元素被执行时:
在所述第一执行模式中,使用所述第一组件中的第一学习率调整组件对学习率进行调整以用于更新网络模型参数;以及
在所述第二执行模式中,使用所述第二组件中的第二学习率调整组件对学习率进行调整以用于更新网络模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011249391.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种节能建筑型水储能系统
- 下一篇:一种线路板的对位方法