[发明专利]一种信息处理方法及装置在审
申请号: | 202111567587.0 | 申请日: | 2021-12-20 |
公开(公告)号: | CN114418059A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 丁疏横;唐忠樑 | 申请(专利权)人: | 每平每屋(上海)科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 王柳焜 |
地址: | 200000 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息处理 方法 装置 | ||
本申请提供了一种信息处理方法及装置。获取基础模型。对于基础模型中的任意一个网络层中的任意一个通道,获取该通道分别与该网络层中的除该通道以外的其他每一个通道之间的距离。将该通道分别与该网络层中的除该通道以外的其他每一个通道之间的距离求和,得到该通道对应的通道距离和。根据各个网络层中的各个通道分别对应的通道距离和获取目标剪枝阈值。根据各个网络层中的各个通道分别对应的通道距离和以及目标剪枝阈值,对各个网络层中的通道进行剪枝处理,得到剪枝后的模型。对剪枝后的模型进行知识蒸馏,得到目标模型。通过本申请,可以降低剪枝后的模型的冗余度及可以提高剪枝后的模型处理数据的效果。
技术领域
本申请涉及计算机技术领域,特别是涉及一种信息处理方法及装置。
背景技术
目前的各种网络模型(例如卷积神经网络等)得到了广泛使用,例如,在图像领域得到了广泛使用等,且网络模型在处理数据方面也取得了较好的效果,但是,很多情况下,网络模型中的参数量大,运算次数多,消耗的系统资源也较多。
发明内容
本申请示出了一种信息处理方法及装置。
第一方面,本申请示出了一种信息处理方法,所述方法包括:
获取基础模型;所述基础模型中包括多个网络层,各个网络层中包括多个通道;
对于所述基础模型中的任意一个网络层中的任意一个通道,获取所述通道分别与所述网络层中的除所述通道以外的其他每一个通道之间的距离;将所述通道分别与所述网络层中的除所述通道以外的其他每一个通道之间的距离求和,得到所述通道对应的通道距离和;
根据各个网络层中的各个通道分别对应的通道距离和获取目标剪枝阈值;
根据各个网络层中的各个通道分别对应的通道距离和以及所述目标剪枝阈值,对各个网络层中的通道进行剪枝处理,得到剪枝后的模型;
对剪枝后的模型进行知识蒸馏,得到目标模型。
第二方面,本申请示出了一种信息处理装置,所述装置包括:
第一获取模块,用于获取基础模型;所述基础模型中包括多个网络层,各个网络层中包括多个通道;
第二获取模块,用于对于所述基础模型中的任意一个网络层中的任意一个通道,获取所述通道分别与所述网络层中的除所述通道以外的其他每一个通道之间的距离;将所述通道分别与所述网络层中的除所述通道以外的其他每一个通道之间的距离求和,得到所述通道对应的通道距离和;
第三获取模块,用于根据各个网络层中的各个通道分别对应的通道距离和获取目标剪枝阈值;
剪枝模块,用于根据各个网络层中的各个通道分别对应的通道距离和以及所述目标剪枝阈值,对各个网络层中的通道进行剪枝处理,得到剪枝后的模型;
蒸馏模块,用于对剪枝后的模型进行知识蒸馏,得到目标模型。
第三方面,本申请示出了一种电子设备,所述电子设备包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行如前述的任一方面所示的方法。
第四方面,本申请示出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如前述的任一方面所示的方法。
第五方面,本申请示出了一种计算机程序产品,当所述计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备能够执行如前述的任一方面所示的方法。
与现有技术相比,本申请包括以下优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于每平每屋(上海)科技有限公司,未经每平每屋(上海)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111567587.0/2.html,转载请声明来源钻瓜专利网。