[发明专利]神经网络的构建方法和装置在审
申请号: | 202010661477.X | 申请日: | 2020-07-10 |
公开(公告)号: | CN111931904A | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 洪伟峻;李桂林;张伟楠;俞勇;张星;李震国 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 王龙华;王君 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 构建 方法 装置 | ||
1.一种神经网络的构建方法,其特征在于,包括:
初始化搜索空间和多个构建块,所述搜索空间中包括多个操作符,所述构建块是由多个节点之间通过所述操作符连接得到的网络结构;
在至少一次训练轮次中,随机丢弃所述多个操作符中的部分操作符,利用未被丢弃的所述操作符更新所述多个构建块;
利用更新后的所述多个构建块构建目标神经网络。
2.如权利要求1所述的方法,其特征在于,所述利用更新后的所述多个构建块构建目标神经网络,包括:
利用最后一次的训练轮次中获得的所述更新后的多个构建块构建所述目标神经网络。
3.如权利要求1或2所述的方法,其特征在于,所述随机丢弃所述多个操作符中的部分操作符,包括:
根据所述多个操作符的种类,将所述多个操作符划分到多个操作符组;
在随机丢弃时,所述多个操作符组中的每个操作符组均保留至少一个操作符。
4.如权利要求3所述的方法,其特征在于,所述多个操作符组具有不完全相同的丢弃率,所述丢弃率用于表示所述多个操作符组中的每种操作符被丢弃的概率。
5.如权利要求3或4所述的方法,其特征在于,所述多个操作符组是根据所述多个操作符中每种操作符所包含的参数数量确定的。
6.如权利要求3至5中任一项所述的方法,其特征在于,所述多个操作符组包括第一操作符组和第二操作符组,所述第一操作符组中的操作符均不包含参数,所述第二操作符组中的操作符均包含参数。
7.如权利要求1至6中任一项所述的方法,其特征在于,所述利用未被丢弃的所述操作符更新所述多个构建块,包括:
在更新所述多个构建块时,只对所述未被丢弃的操作符所包含的参数进行权重衰减。
8.如权利要求1至7中任一项所述的方法,其特征在于,所述方法还包括:
根据被丢弃的所述操作符和所述未被丢弃的操作符的关系,调整所述更新后的多个构建块的架构参数。
9.如权利要求1至8中任一项所述的方法,其特征在于,所述操作符包括以下至少一种:跳连接、平均池化、最大池化、可分离卷积、扩大可分离卷积、置零操作。
10.如权利要求1至9中任一项所述的方法,其特征在于,所述方法还包括:
获取图像分类训练样本;
利用所述图像分类训练样本对所述目标神经网络进行训练,获得图像分类模型,所述图像分类模型用于对图像进行分类。
11.如权利要求1至9中任一项所述的方法,其特征在于,所述方法还包括:
获取目标检测训练样本;
利用所述目标检测训练样本对所述目标神经网络进行训练,获得目标检测模型,所述目标检测模型用于从待处理图像中检测出目标。
12.如权利要求11所述的方法,其特征在于,所述目标包括以下至少一种:车辆、行人、障碍物、道路标识、交通标识。
13.一种神经网络的构建装置,其特征在于,包括:
初始化单元,用于初始化搜索空间和多个构建块,所述搜索空间中包括多个操作符,所述构建块是由多个节点之间通过所述操作符连接得到的网络结构;
训练单元,用于在至少一次训练轮次中,随机丢弃所述多个操作符中的部分操作符,利用未被丢弃的所述操作符更新所述多个构建块;
所述训练单元还用于,利用更新后的所述多个构建块构建目标神经网络。
14.如权利要求13所述的装置,其特征在于,所述训练单元具体用于,利用最后一次的训练轮次中获得的所述更新后的多个构建块,构建所述目标神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010661477.X/1.html,转载请声明来源钻瓜专利网。