[发明专利]一种神经网络搜索方法、装置、设备及存储介质在审
申请号: | 202211181426.2 | 申请日: | 2022-09-27 |
公开(公告)号: | CN115511052A | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 张磊;李富康 | 申请(专利权)人: | 中科物栖(北京)科技有限责任公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 任晓婷 |
地址: | 100088 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 搜索 方法 装置 设备 存储 介质 | ||
1.一种神经网络搜索方法,其特征在于,包括:
利用自动化人工智能的神经结构搜索算法,确定神经网络搜索空间;
对所述神经网络搜索空间内每个神经网络结构进行超参数配置,并对配置的超参数进行优化;
对超参数配置后的神经网络进行网络性能评分,并根据所有所述神经网络对应的网络性能评分选择出最优神经网络。
2.根据权利要求1所述的神经网络搜索方法,其特征在于,所述对所述神经网络搜索空间内每个神经网络结构进行超参数配置,包括:
利用超参数计算公式对所述神经网络搜索空间内每个神经网络结构进行超参数配置。
3.根据权利要求2所述的神经网络搜索方法,其特征在于,所述利用超参数计算公式对所述神经网络搜索空间内每个神经网络结构进行超参数配置,包括:
从所有已配置超参数的神经网络对应的网络性能评分中选择出最高性能评分;
基于所述最高性能评分,利用超参数计算公式对所述神经网络搜索空间内的一个神经网络结构进行超参数配置,直至所述神经网络搜索空间内每个神经网络结构均被配置超参数。
4.根据权利要求3所述的神经网络搜索方法,其特征在于,所述超参数计算公式如下:
其中,λ为超参数;Mλ为针对超参数的回归模型;σ为标准差;μ为期望,fbest为最高性能评分;为标准正态分布的累积分布函数;ψ为标准正态分布的概率密度。
5.根据权利要求1所述的神经网络搜索方法,其特征在于,所述对配置的超参数进行优化,包括:
利用预先基于贝叶斯优化算法构建的针对超参数的回归模型,对配置的超参数进行优化;所述回归模型用于对超参数的性能评估的条件概率进行建模。
6.根据权利要求1所述的神经网络搜索方法,其特征在于,所述对超参数配置后的神经网络进行网络性能评分,包括:
根据超参数配置后的神经网络对应的目标网络参数,利用预设评价公式进行神经网络的性能评分;
其中,所述目标网络参数包括计算精确度、计算速度和能耗;所述性能评分公式为每个所述目标网络参数和各自对应的权重的加权和。
7.根据权利要求1至6任一项所述的神经网络搜索方法,其特征在于,所述对超参数配置后的神经网络进行网络性能评分之前,还包括:
将所述超参数配置后的神经网络部署到预先构建的模拟平台;所述模拟平台为基于神经网络加速器和中央处理器构建的平台;
利用所述模拟平台对所述神经网络进行运行模拟,以便从网络输出结果中得到所述神经网络对应的各类网络参数。
8.一种神经网络搜索装置,其特征在于,包括:
搜索空间确定模块,用于利用自动化人工智能的神经结构搜索算法,确定神经网络搜索空间;
超参数配置模块,用于对所述神经网络搜索空间内每个神经网络结构进行超参数配置,并对配置的超参数进行优化;
性能评价模块,用于对超参数配置后的神经网络进行网络性能评分,并根据所有所述神经网络对应的网络性能评分选择出最优神经网络。
9.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求1至7任一项所述的神经网络搜索方法。
10.一种计算机可读存储介质,其特征在于,用于存储计算机程序;其中计算机程序被处理器执行时实现如权利要求1至7任一项所述的神经网络搜索方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科物栖(北京)科技有限责任公司,未经中科物栖(北京)科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211181426.2/1.html,转载请声明来源钻瓜专利网。