[发明专利]神经网络构建方法、装置、设备及介质在审

申请号：	202011403214.5	申请日：	2020-12-04
公开（公告）号：	CN112598110A	公开（公告）日：	2021-04-02
发明（设计）人：	张选杨	申请（专利权）人：	北京迈格威科技有限公司
主分类号：	G06N3/04	分类号：	G06N3/04;G06N3/08
代理公司：	北京润泽恒知识产权代理有限公司 11319	代理人：	王婷婷
地址：	100086 北京市海淀区科***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	神经网络构建方法装置设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供了一种神经网络构建方法、装置、设备及介质，所述方法包括：从原始神经网络中确定待替换的卷积层；将所述待替换的卷积层替换为目标卷积层，得到目标卷积神经网络；其中，所述目标卷积层的目标卷积核参数是根据所述原始神经网络的裁剪率，对所述待替换的原始卷积层卷积核参数进行调整后得到的；所述目标卷积层用于按照所述目标卷积核参数对待卷积的特征图进行卷积操作，得到卷积后的特征图。

技术领域

本发明涉及计算机处理技术领域，特别是涉及一种神经网络构建方法、装置、设备及介质。

背景技术

近年来，随着人工神经网络复杂度的增加，模型的表达能力也随之提升。然而，神经网络模型的复杂度增加虽然能够提升模型的表达能力和性能，但是，随之而来的，模型也会增加的大量参数和计算复杂度，尤其是对于嵌入式设备、自动驾驶领域等资源受限的应用场景下，更不可能无限制的靠增加模型复杂度来提高模型预测性能。因此，为了加快人工智能的落地，需要在保证模型预测准确率的前提下，尽量减小模型的复杂度。

相关技术中，一般通过模型剪枝对模型进行压缩，以尽可能减少模型参数或者计算复杂度。但是，采用此种方式时，每一卷积层都需要人工根据取得的通道数下标来筛选出对应的通道参数，并将其聚拢。此种方式非常耗时，导致模型预测的效果仍然较低。

发明内容

鉴于上述问题，提出了本发明实施例的一种神经网络构建方法、装置、设备及介质，以便克服上述问题或者至少部分地解决上述问题。

本发明实施例的第一方面，公开了一种神经网络构建方法，所述方法包括：

从原始神经网络中确定待替换的卷积层；

将所述待替换的卷积层替换为目标卷积层，得到目标卷积神经网络；

其中，所述目标卷积层的目标卷积核参数是根据所述原始神经网络的裁剪率，对所述待替换的原始卷积层卷积核参数进行调整后得到的；

所述目标卷积层用于按照所述目标卷积核参数对待卷积的特征图进行卷积操作，得到卷积后的特征图。

可选地，所述目标卷积层包括第一卷积层和第二卷积层，所述第一卷积层中的卷积核和所述第二卷积层中的卷积核均为1*1卷积核；

所述第一卷积层用于根据所述裁减率，对所述原始卷积核参数中的输入通道数进行调整，得到调整后的第一卷积核参数；

所述第二卷积层用于根据所述裁减率和所述调整后的第一卷积核参数，对所述原始卷积层卷积核参数中的输出通道数进行调整。

可选地，所述目标卷积层还包括：第一维度交换模块、第二维度交换模块，其中，所述第一维度交换模块连接在所述第一卷积层和所述第二卷积层之间，所述第二维度交换模块连接在所述第二卷积层和所述目标卷积层的输出端之间；