[发明专利]超网络的模型结构采样方法、装置以及电子设备在审
申请号: | 201911047714.7 | 申请日: | 2019-10-30 |
公开(公告)号: | CN110766089A | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 希滕;张刚;温圣召 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 11313 北京市铸成律师事务所 | 代理人: | 杨瑾瑾;徐瑞红 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征图 采样 约束条件 多路径搜索 模型结构 采样模型 电子设备 多次采样 网络 多层 构建 相等 重复 申请 保证 | ||
本申请公开了一种超网络的模型结构采样方法、装置以及电子设备,涉及超网络的模型结构采样领域。具体实现方案为:构建超网络的多路径搜索空间,多路径搜索空间包括多层特征图,每层特征图包括多个尺寸的特征图;在多路径搜索空间中,选择同时满足第一约束条件和第二约束条件的模型结构,作为采样模型;其中,第一约束条件为特征图层之间的各连接在多次采样的过程中被采样的次数相等;第二约束条件为与第l‑1层特征图中特征图连接的第l层特征图的特征图,连接至第l+1层特征图,l大于或等于2。采样没有重复,提高了采样的效率,节省了资源。同时,保证了采样的有效性。
技术领域
本申请涉及一种计算机视觉领域,尤其涉及一种超网络的模型结构采样领域。
背景技术
深度学习技术在很多方向上都取得了巨大的成功,最近几年NAS技术(NeuralArchitecture Search,神经网络架构搜索)成为研究热点。NAS是用算法代替繁琐的人工操作,在海量的搜索空间中自动搜索出最佳的神经网络架构。超网络的核心思想是通过参数共享的方式,可以同时训练大量网络结构,无需对每一个网络结构进行训练。目前,在超网络的搜索空间中进行模型结构自动搜索的时候,由于两个特征图层之间只能选择一条链路,导致单路径的超网络搜索空间受到限制,最终搜索得到的模型结构的性能较差。在单路径的超网络搜索空间中进行采样,并不能得到较好的采样模型,导致网络模型的性能整体较差。
发明内容
本申请实施例提供一种超网络的模型结构采样方法、装置以及电子设备,以解决现有技术中的一个或多个技术问题。
第一方面,提供了一种超网络的模型结构采样方法,包括:
构建超网络的多路径搜索空间,多路径搜索空间包括多层特征图,每层特征图包括多个尺寸的特征图;
在多路径搜索空间中,选择同时满足第一约束条件和第二约束条件的模型结构,作为采样模型;
其中,第一约束条件为特征图层之间的各连接在多次采样的过程中被采样的次数相等;
第二约束条件为与第l-1层特征图中特征图连接的第l层特征图的特征图,连接至第l+1层特征图,l大于或等于2。
本实施方式中,第一约束条件保证了在多次采样中,特征图层之间的各个连接被采样的次数相等。由于模型结构是特征图层之间的连接组成的链路,所以各个连接被采样的次数相等,能够保证每次采样得到的多个模型结构不重复,提高了采样效率,节省了资源。第二约束条件保证了采样的有效性。
在一种实施方式中,构建超网络的多路径搜索空间包括:
对第l层特征图中任意一个特征图,经过下采样得到第l+1层特征图,第l+1层特征图中包括多个尺寸的特征图;
对第l层特征图中任意一个特征图,经过上采样得到第l-1层特征图,第l+1层特征图中包括多个尺寸的特征图;
根据第l层特征图、l+1层特征图以及第l-1层特征图构建超网络的多路径搜索空间,l大于或等于2。
在本实施方式中,超网络的多路径搜索空间中,实现了多尺寸特征图的融合,有效扩大了超网络的搜索空间,能够搜索得到更多的模型结构。
在一种实施方式中,第一约束条件的公式表示:
其中,D表示每层特征图中K包含的特征图的集合,L表示特征图层数l的集合,k表示第k次采样的标识,S表示一次采样,din1表示第l层特征图中的第一特征图的输入,dout1表示第一特征图连接至第l+1层特征图中一特征图的输出,din2表示第l层特征图中的第二特征图的输入,dout2表示第一特征图连接至第l+1层特征图中一特征图的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911047714.7/2.html,转载请声明来源钻瓜专利网。