[发明专利]用于搜索模型结构的方法和装置有效
申请号: | 202010503202.3 | 申请日: | 2020-06-05 |
公开(公告)号: | CN111667056B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 希滕;张刚;温圣召 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F18/24 | 分类号: | G06F18/24;G06N3/0464;G06N3/044;G06N3/0475;G06N3/092;G06N3/084;G06V10/764;G06V10/82 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 搜索 模型 结构 方法 装置 | ||
本申请公开了用于搜索模型结构的方法和装置,涉及人工智能、深度学习和图像处理技术领域。该方法包括:获取待替换模型结构在至少一个预设召回率下的分类阈值;确定模型结构的搜索空间,初始化模型结构生成器,并迭代以下步骤:利用模型结构生成器在搜索空间中搜索出候选模型结构,训练候选模型结构并获取训练后的候选模型结构在各预设召回率下的分类阈值;根据训练后的候选模型结构与待替换模型结构在同一预设召回率下的分类阈值之间的差异生成反馈信息,并在执行下一次迭代前基于该反馈信息更新模型结构生成器;当模型结构生成器达到预设的收敛条件时停止迭代,将当前迭代操作中的候选模型结构确定为目标模型结构。采用本方法可以提高搜索模型结构的准确性。
技术领域
本公开的实施例涉及计算机技术领域,具体涉及人工智能、深度学习和图像处理技术领域,尤其涉及用于搜索模型结构的方法和装置。
背景技术
深度学习技术在很多方向上都取得了巨大的成功。在深度学习技术中,模型结构(即,神经网络的结构)的好坏对最终模型的效果有非常重要的影响。然而,人工设计模型结构需要设计者具有非常丰富的经验并且需要搜索各种组合方式,由于众多网络参数会产生爆炸式的组合方式,常规的随机搜索几乎不可行。因此,最近几年神经网络架构搜索技术(Neural Architecture Search,简称NAS)成为研究热点,其利用算法代替繁琐的人工操作来自动搜索最佳的模型结构。
现有的基于NAS的模型结构自动搜索方法搜索出的模型结构存在准确度低的问题。
发明内容
提供了一种用于搜索模型结构的方法、装置、电子设备以及计算机可读存储介质。
根据第一方面,提供了一种用于搜索模型结构的方法,该方法包括:
获取待替换模型结构在至少一个预设召回率下的分类阈值,其中分类阈值包括:待替换模型结构将待分类数据的特征映射至对应的类别所采用的门限值;
确定模型结构的搜索空间,初始化模型结构生成器,并通过多轮迭代操作搜索出目标模型结构;迭代操作包括:利用模型结构生成器在搜索空间中搜索出候选模型结构,对该候选模型结构进行训练并获取训练后的候选模型结构在各预设召回率下的分类阈值;根据训练后的候选模型结构与待替换模型结构在同一预设召回率下的分类阈值之间的差异生成反馈信息,模型结构生成器的在执行下一次迭代操作前基于反馈信息更新;响应于确定模型结构生成器达到预设的收敛条件,将当前迭代操作中的候选模型结构确定为目标模型结构。
根据第二方面,提供了一种用于搜索模型结构的装置,该装置包括:
获取单元,被配置为获取待替换模型结构在至少一个预设召回率下的分类阈值,其中分类阈值包括:待替换模型结构将待分类数据的特征映射至对应的类别所采用的门限值;搜索单元,被配置为确定模型结构的搜索空间,初始化模型结构生成器,并通过多轮迭代操作搜索出目标模型结构;搜索单元包括:计算单元,被配置为执行迭代操作中的如下步骤:利用模型结构生成器在搜索空间中搜索出候选模型结构,对该候选模型结构进行训练并获取训练后的候选模型结构在各预设召回率下的分类阈值;生成单元,被配置为执行迭代操作中的如下步骤:根据训练后的候选模型结构与待替换模型结构在同一预设召回率下的分类阈值之间的差异生成反馈信息,模型结构生成器在执行下一次迭代操作前基于反馈信息更新;确定单元,被配置为执行迭代操作中的如下步骤:响应于确定模型结构生成器达到预设的收敛条件,将当前迭代操作中的候选模型结构确定为目标模型结构。
根据第三方面,本公开的实施例提供了一种电子设备,包括:一个或多个处理器:存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面提供的用于搜索模型结构的方法。
根据第四方面,本公开的实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,程序被处理器执行时实现第一方面提供的用于搜索模型结构的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010503202.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种支架
- 下一篇:用于搜索模型结构的方法和装置