[发明专利]基于超网络的模型结构采样、装置以及电子设备在审
申请号: | 201910861008.X | 申请日: | 2019-09-11 |
公开(公告)号: | CN110580520A | 公开(公告)日: | 2019-12-17 |
发明(设计)人: | 希滕;张刚;温圣召 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 11313 北京市铸成律师事务所 | 代理人: | 王珺;徐瑞红 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型结构 邻居 采样模型 迭代更新 网络 初始化 采样策略 参数共享 电子设备 神经网络 收敛条件 搜索空间 循环迭代 采样 迭代 更新 搜索 申请 保证 | ||
1.一种基于超网络的模型结构采样方法,其特征在于,包括:
获取超网络中初始化的模型结构;
迭代更新所述初始化的模型结构的参数,得到第一个邻居模型结构;
根据所述第一个邻居模型结构的参数进行循环迭代更新,直至满足超网络的收敛条件的情况下,得到第N个邻居模型结构,N大于或等于2;
将所述第一个邻居模型结构至所述第N个邻居模型结构作为采样模型结构。
2.根据权利要求1所述的方法,其特征在于,还包括:
从所述第一个邻居模型结构至所述第N个邻居模型结构中,连续选择多组邻居模型结构,每组邻居模型结构包括M个邻居模型结构,M大于或等于1;
获取每组邻居模型结构对应的至少一个梯度,并根据所述至少一个梯度计算每组邻居模型结构对应的平均梯度;
利用每组邻居模型结构对应的平均梯度更新一次所述超网络的参数。
3.根据权利要求1所述的方法,其特征在于,还包括:
从所述第一个邻居模型结构至所述第N个邻居模型结构中,连续选择多组邻居模型结构,相邻两组邻居模型结构中的邻居模型结构的个数均相差第一阈值个数;
获取每组邻居模型结构对应的至少一个梯度,并根据所述至少一个梯度计算每组邻居模型结构对应的平均梯度;
利用每组邻居模型结构对应的平均梯度更新一次所述超网络的参数。
4.根据权利要求1至3任一项所述的方法,其特征在于,相邻的两个所述邻居模型结构之间包含有第二阈值个数的相同参数。
5.一种基于超网络的模型结构采样装置,其特征在于,包括:
初始化模型获取模块,用于获取超网络中初始化的模型结构;
邻居模型获取模块,用于迭代更新所述初始化的模型结构的参数,得到第一个邻居模型结构;
迭代更新模块,用于根据所述第一个邻居模型结构的参数进行循环迭代更新,直至满足超网络的收敛条件的情况下,得到第N个邻居模型结构,N大于或等于2;
采样模型确定模块,用于将所述第一个邻居模型结构至第N个邻居模型结构作为采样模型结构。
6.根据权利要求5所述的装置,其特征在于,还包括:
第一邻居模型选择模块,用于从所述第一个邻居模型结构至所述第N个邻居模型结构中,连续选择多组邻居模型结构,每组邻居模型结构包括M个邻居模型结构,M大于或等于1;
平均梯度计算模块,用于获取每组邻居模型结构对应的至少一个梯度,并根据所述至少一个梯度计算每组邻居模型结构对应的平均梯度;
超网络参数更新模块,用于利用每组邻居模型结构对应的平均梯度更新一次所述超网络的参数。
7.根据权利要求5所述的装置,其特征在于,还包括:
第二邻居模型选择模块,用于从所述第一个邻居模型结构至所述第N个邻居模型结构中,连续选择多组邻居模型结构,相邻两组邻居模型结构中的邻居模型结构的个数均相差第一阈值个数;
平均梯度计算模块,用于获取每组邻居模型结构对应的至少一个梯度,并根据所述至少一个梯度计算每组邻居模型结构对应的平均梯度;
超网络参数更新模块,利用每组邻居模型结构对应的平均梯度更新一次所述超网络的参数。
8.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任一项所述的方法。
9.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-4中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910861008.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种卷积运算装置及其方法
- 下一篇:一种自组织协同神经网络模型学习及构建方法