[发明专利]生成神经网络模型的方法、装置及存储介质有效
申请号: | 201910718494.X | 申请日: | 2019-08-05 |
公开(公告)号: | CN112329909B | 公开(公告)日: | 2022-10-21 |
发明(设计)人: | 陈伟杰;张渊;谢迪;浦世亮 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 李珂珂 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 神经网络 模型 方法 装置 存储 介质 | ||
1.一种生成神经网络模型的方法,其特征在于,应用于终端,所述方法包括:
获取第一神经网络模型,所述第一神经网络模型是指已训练的网络模型;
根据所述第一神经网络模型中的N个层,构建第二神经网络模型,所述第一神经网络模型包括的层的数量大于所述N,所述N为与所述终端中的运算平台的运算能力适配的神经网络模型的层数,所述运算平台包括中央处理器CPU、图形处理器GPU、数字信号处理DSP芯片、现场可编程门阵列FPGA和AI处理器中的至少一种;
其中,所述第二神经网络模型包括所述第一神经网络模型中的N个层,所述第二神经网络模型的N个层中的批归一化BN层的参数信息是通过对所述第一神经网络模型中对应的BN层的参数信息进行调整得到,所述第二神经网络模型的N个层中除所述BN层之外的其余层的参数信息采用所述第一神经网络模型中对应层的参数信息;
通过所述第二神经网络模型进行图像识别。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据第一控制数组,从初始神经网络模型中采样与所述第一控制数组对应的神经网络模型,所述第一控制数组用于指示从所述初始神经网络模型中采样的层的位置;
根据多个第一训练样本对采样的神经网络模型进行训练;
根据训练后的神经网络模型中每个层的参数信息对所述初始神经网络模型中对应的层的参数信息进行更新,并对所述第一控制数组进行更新,返回所述根据第一控制数组,从初始神经网络模型中采样与所述第一控制数组对应的神经网络模型的步骤,直到达到训练截止条件为止,将最后一次更新的初始神经网络模型作为所述第一神经网络模型。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一神经网络模型中的N个层,构建第二神经网络模型,包括:
获取第二控制数组,所述第二控制数组用于指示待采样的所述第一神经网络模型中N个层的位置;
根据所述第二控制数组,从所述第一神经网络模型中采样N个层;
根据采样得到的N个层,构建第三神经网络模型;
如果所述第三神经网络模型的运行速度不大于参考运行速度,或者如果所述第三神经网络模型的运算精度不大于参考精度,则对所述第二控制数组进行更新,返回所述根据所述第二控制数组,从所述第一神经网络模型中采样N个层的步骤,直到达到采样截止条件为止,将根据最后一次采样的N个层构建的第三神经网络模型作为所述第二神经网络模型。
4.根据权利要求3所述的方法,其特征在于,所述根据采样得到的N个层,构建第三神经网络模型,包括:
从所述第一神经网络模型中获取采样得到的N个层中每个层的参数信息;
根据采样得到的N个层和获取到的参数信息生成第四神经网络模型;
根据多个第二训练样本对所述第四神经网络模型包括的N个层中的每个BN层的参数信息进行调整,将调整后的第四神经网络模型作为所述第三神经网络模型。
5.根据权利要求3或4所述的方法,其特征在于,所述采样截止条件是指从所述第一神经网络模型中采样N个层的次数达到参考次数,所述参考次数小于从所述第一神经网络模型的全部层中取出N个层的组合数。
6.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:
如果所述第三神经网络模型的运行速度大于参考运行速度,且所述第三神经网络模型的运算精度大于参考精度,则将所述第三神经网络模型作为所述第二神经网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910718494.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:风扇模组
- 下一篇:一种保护电路和集成电路芯片