[发明专利]一种生成神经网络的方法、装置、计算机设备和存储介质在审
申请号: | 202111314991.7 | 申请日: | 2021-11-08 |
公开(公告)号: | CN113988272A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 刘吉豪;刘宇;宋广录;黄鑫 | 申请(专利权)人: | 上海商汤智能科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 北京中知恒瑞知识产权代理事务所(普通合伙) 11889 | 代理人: | 袁忠林 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 生成 神经网络 方法 装置 计算机 设备 存储 介质 | ||
1.一种生成神经网络的方法,包括:
确定预设网络结构单元对应的第一搜索空间,下采样处理单元对应的第二搜索空间以及神经网络结构的尺寸信息对应的第三搜索空间,所述预设网络结构单元和所述下采样处理单元用于构建神经网络结构;
基于所述第一搜索空间、所述第二搜索空间和所述第三搜索空间,以及预设的深度学习任务对应的训练数据集,进行网络结构搜索,得出与所述深度学习任务的期望结果对应的目标神经网络结构;
基于所述目标神经网络结构生成用于处理深度学习任务的目标神经网络。
2.根据权利要求1所述的方法,其中,所述第一搜索空间包括卷积结构单元、基于自注意力机制的编码-解码结构单元和多层感知器MLP结构单元中的至少两个。
3.根据权利要求1或2所述的方法,其中,所述第二搜索空间包括局部下采样单元,全局下采样单元和全局-局部下采样单元,其中,所述局部下采样单元用于采样局部上下文信息,所述全局下采样单元用于采样全局上下文信息,所述全局-局部下采样单元用于采样全局上下文信息和局部上下文信息。
4.根据权利要求3所述的方法,其中,所述局部下采样单元包括用于执行卷积操作的第一卷积算子;
所述全局下采样单元包括基于自注意力机制的第一处理单元和用于对输入所述第一处理单元的数据进行卷积操作的第二卷积算子;
所述全局-局部下采样单元包括基于自注意力机制的第二处理单元和用于对输入所述第二处理单元的数据进行卷积操作的第三卷积算子。
5.根据权利要求1所述的方法,其中,所述基于所述第一搜索空间、所述第二搜索空间和所述第三搜索空间,以及预设的深度学习任务对应的训练数据集,进行网络结构搜索,包括:
基于所述第一搜索空间、所述第二搜索空间和所述第三搜索空间构建目标搜索空间;
基于所述目标搜索空间确定多个候选神经网络结构;其中,每一个所述候选神经网络结构包括从第一搜索空间中选取得到的至少一个预设网络结构单元、从第二搜索空间中选取得到的至少一个下采样处理单元,且每一个所述候选神经网络中的每一个预设网络结构单元的尺寸信息为从所述第三搜索空间中选取得到的尺寸信息;
基于所述候选神经网络结构构建对应的候选神经网络;
采用所述预设的深度学习任务对应的训练数据集确定所述候选神经网络对所述深度学习任务的处理结果;
以所述候选神经网络对所述深度学习任务的处理结果与所述期望结果之间的差异最小化为目标,基于所述候选神经网络结构,在所述目标搜索空间内搜索出目标神经网络结构。
6.根据权利要求5所述的方法,其中,所述基于所述候选神经网络结构,在所述目标搜索空间内搜索出目标神经网络结构,包括:
基于部分候选神经网络结构中每个目标候选神经网络结构对所述深度学习任务的处理结果,分别更新每个预设网络结构单元的第一选取概率、每个下采样处理单元的第二选取概率,以及每个预设网络结构单元对应的尺寸信息的第三选取概率;
基于更新后的第一选取概率、第二选取概率和第三选取概率进行网络结构搜索,重新选取出多个新的目标候选神经网络结构;
在所述多个新的目标候选神经网络结构分别对所述深度学习任务的处理结果与所述期望结果之间的差异均不满足第一预设条件的情况下,返回执行更新选取概率的步骤。
7.根据权利要求6所述的方法,其中,所述基于部分候选神经网络结构中每个目标候选神经网络结构对所述深度学习任务的处理结果,分别更新每个预设网络结构单元的第一选取概率、每个下采样处理单元的第二选取概率,以及每个预设网络结构单元对应的尺寸信息的第三选取概率,包括:
基于部分候选神经网络结构中每个目标候选神经网络结构对所述深度学习任务的处理结果,确定所述处理结果对应的准确度满足第二预设条件的目标候选神经网络结构;
基于所述处理结果对应的准确度满足第二预设条件的目标候选神经网络结构,分别更新每个预设网络结构单元的第一选取概率、每个下采样处理单元的第二选取概率,以及每个预设网络结构单元对应的尺寸信息的第三选取概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海商汤智能科技有限公司,未经上海商汤智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111314991.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通风盖板系统和汽车
- 下一篇:一种叉臂联动车辆搬运机器人及其叉车方法