[发明专利]超网络训练方法及装置、电子设备、存储介质在审

申请号：	201911102261.3	申请日：	2019-11-12
公开（公告）号：	CN110956262A	公开（公告）日：	2020-04-03
发明（设计）人：	初祥祥;张勃;许瑞军;王斌	申请（专利权）人：	北京小米智能科技有限公司
主分类号：	G06N3/08	分类号：	G06N3/08
代理公司：	北京博思佳知识产权代理有限公司 11415	代理人：	王茹
地址：	100085 北京市海淀区清河***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	网络训练方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开是关于一种超网络训练方法及装置、电子设备、存储介质。一种超网络训练方法，包括：通过获取多路径神经子网络，对所述多路径神经子网络进行训练，以更新各子结构的权重参数；将所述多路径神经子网络中各子结构的权重参数同步至所述初始超网络；在超网络收敛时结束训练并得到目标超网络。这样，在单条路径表征能力有限的情况下，本实施例中利用多路径神经子网络训练超网络，有利于提升超网络的表征能力。

技术领域

本公开涉及深度学习技术领域，尤其涉及一种超网络训练方法及装置、电子设备、存储介质。

背景技术

目前，现有神经网络架构搜索(NAS)中，通常采用单路径神经子网络来实现，即从超网络中每一层仅采样一个子模块，并将采样的子模块顺序串联，可以组成一个单路径神经子网络；然后，从超网络中共享各层子模块的参数；之后，对该单路径神经子网络进行单步训练。在该单路径神经子网络训练结束后，将各子模块的参数再共享给超网络。这样，循环“采样-共享参数-单步训练-更新参数”步骤，直到超网络训练收敛。

上述神经网络架构搜索方案中，每次采样训练的单路径神经子网络中，为保证所采样子模块的公平性，每层中只能采样一个子结构，但是这样会限制神经网络的表征能力。

发明内容

本公开提供一种超网络训练方法及装置、电子设备、存储介质，以解决相关技术的不足。

根据本公开实施例的第一方面，提供一种超网络训练方法，所述方法包括：

基于预先构建的初始超网络获取多路径神经子网络；

对所述多路径神经子网络进行训练，以更新各子结构的权重参数；

将所述多路径神经子网络中各子结构的权重参数同步至所述初始超网络；

判断所述初始超网络是否收敛，若不收敛，则返回执行基于预先构建的初始超网络获取多路径神经子网络的步骤；若收敛则结束训练并得到目标超网络。

可选地，所述基于预先构建的初始超网络获取多路径神经子网络包括：

针对预先构建的超网络的各层，从所述各层中采样出至少一个子结构，并增加用于对所述至少一个子结构的输出结果进行相加的输出端，得到包含所述至少一个子结构和所述输出端的子结构单元；

按照所述各层的顺序串联每个子结构单元，得到初始的多路径神经子网络；

对所述初始超网络和初始的多路径神经子网络中相同子结构进行参数共享，获得最终的多路径神经子网络。