[发明专利]神经网络的生成方法、设备及计算机可读存储介质在审
申请号: | 202010581487.2 | 申请日: | 2020-06-23 |
公开(公告)号: | CN113837374A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 裘瑞涛;杨玺坤;骆庆开;韩炳涛;王永成;屠要峰 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06K9/62 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 陈均钦 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 生成 方法 设备 计算机 可读 存储 介质 | ||
1.一种神经网络的生成方法,包括:
获取最优微单元,根据所述最优微单元构建第一网络;
利用预设的训练数据集训练所述第一网络,得到第二网络;
构建第三网络,并利用所述第二网络训练所述第三网络的各个微单元,其中,所述第三网络的微单元数目少于所述第一网络的最优微单元数目;
根据所述第三网络中训练后的所述微单元,得到神经网络模型。
2.根据权利要求1所述的神经网络的生成方法,其特征在于,所述根据所述最优微单元构建第一网络,包括:
根据预定义的尺寸,堆叠所述最优微单元N次以生成所述第一网络,其中,所述N为2的整数次幂。
3.根据权利要求2所述的神经网络的生成方法,其特征在于,所述构建第三网络,包括:
构建微单元数目满足N/M且大于1个的所述第三网络,其中,M为2的整数次幂;
对所有所述第三网络进行初始化。
4.根据权利要求3所述的神经网络的生成方法,其特征在于,所述根据所述第三网络中训练后的所述微单元,得到神经网络模型,包括:
将已完成训练的所述微单元进行组合,得到不同微单元数量的所述神经网络模型,且所述神经网络模型的数目范围为2-N个。
5.根据权利要求1至4任一项所述的神经网络的生成方法,其特征在于,所述利用所述第二网络训练所述第三网络的各个微单元,包括:
利用所述第二网络配合所述训练数据集,并通过所述第二网络的局部输入输出方式训练所述第三网络的各个微单元。
6.根据权利要求1所述的神经网络的生成方法,其特征在于,还包括:
对每个所述神经网络模型进行测试或评估,选取满足预设条件的神经网络模型作为目标神经网络。
7.根据权利要求6所述的神经网络的生成方法,其特征在于,所述对每个所述神经网络模型进行测试,选取符合预设条件的神经网络模型作为目标神经网络,包括:
利用预设的测试数据集对每个所述神经网络模型进行测试,获取每个所述神经网络模型的测试准确率;
利用每个所述神经网络模型分别执行相同的任务,获取每个所述神经网络模型的时延;
若目标神经网络模型的时延低于预设值且测试准确率为最佳值,则确定所述目标神经网络模型为所述目标神经网络。
8.根据权利要求1所述的神经网络的生成方法,其特征在于,所述获取最优微单元,包括:
根据神经网络架构搜索NAS算法,利用预设的搜索空间获得所述最优微单元的网络结构。
9.一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8中任意一项所述的神经网络的生成方法。
10.一种计算机可读存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令用于执行如权利要求1至8中任意一项所述的神经网络的生成方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010581487.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:混合组网下的迁移方法、存储介质和电子设备
- 下一篇:一种车辆的控制方法及装置