[发明专利]计算机执行的神经网络模型获取方法及装置在审
申请号: | 202011593032.9 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112686299A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 张选杨 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08;G06N3/04 |
代理公司: | 北京钲霖知识产权代理有限公司 11722 | 代理人: | 李英艳;李志新 |
地址: | 100080 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算机 执行 神经网络 模型 获取 方法 装置 | ||
1.一种计算机执行的神经网络模型获取方法,其中,所述神经网络模型获取方法包括:
获取训练集,其中,所述训练集包括多个训练数据及所述训练数据对应的分类标签;
基于所述训练集训练初始状态的超网络,得到训练完成的超网络,其中,所述超网络包括多个候选节点;
基于所述训练完成的超网络,进行模型搜索,得到多个由所述候选节点组成的子网络,形成候选集;
基于所述候选集中子网络的参数的变化程度,确定神经网络模型,其中,所述候选集中子网络的参数的变化程度包括,所述子网络的参数在训练后与训练前相比的变化程度。
2.根据权利要求1所述的计算机执行的神经网络模型获取方法,其中,所述子网络的参数的变化程度,通过以下方式确定:
基于组成所述子网络的候选节点在训练前的参数,确定第一向量;
基于组成所述子网络的候选节点在训练后的参数,确定第二向量;
基于所述第一向量和所述第二向量之间的距离,确定所述子网络的参数的变化程度。
3.根据权利要求2所述的计算机执行的神经网络模型获取方法,其中,所述第一向量和所述第二向量之间的距离包括以下任一项:余弦距离、欧氏距离、或曼哈顿距离。
4.根据权利要求1-3任一项所述的计算机执行的神经网络模型获取方法,其中,所述基于所述候选集中子网络的参数的变化程度,确定神经网络模型,包括:
第一步骤,将候选集中参数的变化程度最大的多个子网络和/或候选集中参数的变化程度大于变化阈值的多个子网络,确定为多个候选网络;
第二步骤,基于所述多个候选网络,生成一个或多个衍生网络;
第三步骤,将全部所述候选网络和全部所述衍生网络,形成新的候选集,并作为新的候选集中的子网络;
重复执行所述第一步骤、所述第二步骤和所述第三步骤至预设次数;
根据形成的全部候选集中参数的变化程度最大的子网络作为所述神经网络模型。
5.根据权利要求4所述的计算机执行的神经网络模型获取方法,其中,所述基于所述多个候选网络,生成一个或多个衍生网络,包括:
基于任意两个或两个以上所述候选网络,重新组合节点,得到衍生网络。
6.根据权利要求4所述的计算机执行的神经网络模型获取方法,其中,所述基于所述多个候选网络,生成一个或多个衍生网络,还包括:
基于任一所述候选网络,根据所述训练完成的超网络中的任意一个或多个候选节点替换所述候选网络的对应的节点,得到衍生网络。
7.根据权利要求1-3任一项所述的计算机执行的神经网络模型获取方法,其中,所述获取训练集,包括:
获取所述多个训练数据;
基于类别,随机生成每个所述训练数据对应的分类标签。
8.根据权利要求1-7任一项所述的计算机执行的神经网络模型获取方法,其中,所述基于所述训练集训练初始状态的超网络,得到训练完成的超网络,包括:
构建所述初始状态的超网络,其中,所述初始状态的超网络包括多个候选节点;
基于所述候选节点,确定待训练的子网络;
基于所述训练集,调整所述待训练的子网络的参数,得到训练后的子网络。
9.根据权利要求8所述的计算机执行的神经网络模型获取方法,其中,重复执行以下步骤至指定次数,得到所述训练完成的超网络:所述基于所述候选节点,确定所述待训练的子网络;以及,基于所述训练集,调整所述待训练的子网络的参数,得到所述训练后的子网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011593032.9/1.html,转载请声明来源钻瓜专利网。