[发明专利]用于训练超网络的方法和装置有效

申请号：	202010116701.7	申请日：	2020-02-25
公开（公告）号：	CN111368973B	公开（公告）日：	2023-09-08
发明（设计）人：	希滕;张刚;温圣召	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06N3/0464	分类号：	G06N3/0464;G06N3/084
代理公司：	北京英赛嘉华知识产权代理有限责任公司 11204	代理人：	王达佐;马晓亚
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于训练网络方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于训练超网络的方法，包括：通过依次执行多次迭代操作获得训练完成的超网络；

所述迭代操作包括：

初始化递归神经网络的参数，并利用所述递归神经网络对当前的超网络进行采样以获得用于处理媒体内容识别任务数据的子网络；

响应于确定保存的反向传播的梯度值的数量未达到预设的数量，根据所述媒体内容识别任务构建用于训练的目标函数，并基于所述子网络对应的媒体内容识别任务的训练数据对所述子网络进行训练以获得训练后的子网络的性能信息，基于训练后的子网络对媒体内容的性能信息，计算所述目标函数的值，对所述子网络的性能信息进行反向传播以更新所述超网络的参数，并保存反向传播的梯度值，其中，所述性能信息为媒体内容识别的准确率；

响应于确定保存的所述梯度值的数量达到预设的数量，对保存的所述梯度值进行均一化处理，将均一化处理的结果作为当前迭代操作中反向传播的梯度值，以更新所述超网络的参数。

2.根据权利要求1所述的方法，其中，所述迭代操作还包括：

响应于确定所述超网络满足预设的收敛条件，停止更新所述超网络的参数；

其中，所述预设的收敛条件包括至少一项：

所述超网络的参数更新率低于预设的阈值，

利用所述递归神经网络对当前的超网络进行采样以获得的子网络的性能信息达到预设的性能约束条件，以及

已执行的迭代操作的次数达到预设的次数阈值。

3.根据权利要求1所述的方法，其中，所述方法还包括：

基于所述训练完成的超网络对用于从所述超网络中采样出子网络的递归神经网络进行训练。

4.根据权利要求3所述的方法，其中，所述基于所述训练完成的超网络对用于从所述超网络中采样出子网络的递归神经网络进行训练，包括：

基于当前的递归神经网络的参数，从训练完成的超网络中采样出子网络；

对从训练完成的超网络中采样出的子网络进行训练，以获取从训练完成的超网络中采样出的子网络的性能信息，基于所述从训练完成超网络中采样出的子网络的性能信息生成反馈信息，将所述反馈信息反馈至所述递归神经网络，以基于所述反馈信息更新所述递归神经网络的参数。