[发明专利]一种裁剪神经网络模型的方法和电子设备有效
申请号: | 201910791699.0 | 申请日: | 2019-08-26 |
公开(公告)号: | CN110472736B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 舒红乔;王奇刚;李远辉;杨安荣;邓建林 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 赵焕 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 裁剪 神经网络 模型 方法 电子设备 | ||
本申请提供了一种裁剪神经网络模型的方法,基于神经元在待裁剪神经元层中的重要度最低,确定第一神经元为待裁剪的神经元,基于与该第一神经元差异度最小,确定第二神经元为待裁剪的神经元,以此类推,确定与上一待裁剪的神经元差异度最低的神经元为新的待裁剪的神经元,直至裁剪的神经元数量满足预设待裁剪的神经元数量为止。由于裁剪的神经元为重要度最低,以及与该重要度最低的神经元差异度最低的神经元,不会对神经网络模型的准确度产生较大的影响,在保证了神经网络模型数据处理准确度的前提下,完成率了对于神经网络模型的压缩裁剪,方便其部署在边缘设备上。
技术领域
本申请涉及电子设备领域,更具体的说,是涉及一种裁剪神经网络模型的方法和电子设备。
背景技术
“边缘智能”作为人工智能落实到真实生活的最后一里路,需在终端设备上运行复杂的深度神经网络模型。
而随着人工智能领域对机器智能化需求的提高,神经网络的结构设计得愈加复杂,所需的计算量和存储空间也随之大大增加,但处于边缘的便携设备(如移动手机的FaceID(刷脸认证)、无人机、去中心化自动驾驶系统等)的计算和存储等资源有限,这使得深度神经网络难以在边缘设备上的高效的部署。因此需对神经网络模型进行压缩裁剪以完成轻量级部署。
所以,亟需一种能够对神经网络模型进行裁剪的方法。
发明内容
有鉴于此,本申请提供了一种裁剪神经网络模型的方法,解决现有技术中边缘设备的资源有限导致其不能支持神经网络模型部署的问题。
为实现上述目的,本申请提供如下技术方案:
一种裁剪神经网络模型的方法,包括:
选择待裁剪神经元层,所述待裁剪神经元层中包含至少两个神经元;
从待裁剪神经元层中选择重要度最低的第一神经元;
计算所述待裁剪神经元层中至少两个神经元之间的差异度;
选取与第一神经元差异度最小的第二神经元,删除所述第一神经元与第二神经元,选择待裁剪神经元层的剩余神经元中与所述第二神经元差异度最低的第三神经元删除,并统计删除的神经元数量,至删除神经元的数量满足预设待裁剪的神经元数量停止删除神经元。
优选的,上述的方法,所述从待裁剪神经元层中选择重要度最低的第一神经元,包括:
依次计算所述待裁剪神经元层中任一神经元与上一神经元层之间的连接度,所述连接度表征所述任一神经元在所述待裁剪神经元层中的重要度;
从计算得到的所述至少两个神经元的重要度,选择重要度数值最小的第一神经元。
优选的,上述的方法,计算所述待裁剪神经元层中第四神经元与上一神经元层之间的连接度,包括:
依据预设的权值序列,依次与上一神经元层中每个神经元的重要度相乘并取和,得到的数值为所述第四神经元与上一神经元层之间的连接度,所述权值序列中针对上一层每个神经元具有一个权值。
优选的,上述的方法,所述计算所述待裁剪神经元层中至少两个神经元之间的差异度,包括:
依次计算所述待裁剪神经元层中任意两个神经元之间的欧式距离;
获取任意神经元与预设个数临近神经元之间的欧式距离,断开所述待裁剪神经元层中除所述预设个数神经元之外的神经元与所述任意神经元之间连接;
依据任意神经元与所述临近神经元的欧式距离,计算所述待裁剪神经元层中任意两个神经元之间的所有测地路径以及测地距离,所述测地路径包括所述任意两个神经元之间的直接连接路径以及间接连接路径;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910791699.0/2.html,转载请声明来源钻瓜专利网。