[发明专利]深度学习模型的压缩方法、装置、设备及存储介质在审
申请号: | 201911144297.8 | 申请日: | 2019-11-20 |
公开(公告)号: | CN112825152A | 公开(公告)日: | 2021-05-21 |
发明(设计)人: | 黄磊;杨春勇;靳丁南;权圣 | 申请(专利权)人: | 马上消费金融股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何倚雯 |
地址: | 401120 重庆市渝北区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 学习 模型 压缩 方法 装置 设备 存储 介质 | ||
本申请提供一种深度学习模型的压缩方法、装置、设备及存储介质;其中,该压缩方法包括将预先训练完成的初始深度学习模型中部分图节点的原始格式修改为预设格式;将格式为预设格式的图节点的数据类型由浮点型数据转换成整型数据,以压缩初始深度学习模型。从而不仅能够提升运算速率,减小模型体积,且不会对模型的预测效果产生影响。
技术领域
本发明涉及计算机技术领域,尤其涉及一种深度学习模型的压缩方法、装置、设备及存储介质。
背景技术
深度学习模型是指已经训练完成的神经网络,网络里含有大量的参数,以记录训练数据的特征信息。
目前,由于深度学习模型中含有大量的节点和参数,使得最终训练完成的模型需要消耗巨大的内存和计算代价;为此,人们一般会对模型进行剪枝处理,以剔除模型中不重要的参数来减少模型的冗余,进而提高运算速率,并减小模型体积。
然而,对模型进行剪枝处理,可能会对模型的预测效果产生影响。
发明内容
本申请提供一种深度学习模型的压缩方法、装置、设备及存储介质,不仅能够提升运算速率,减小模型体积,且不会对模型的预测效果产生影响。
为解决上述技术问题,本申请采用的第一个技术方案是:一种深度学习模型的压缩方法,该压缩方法包括:
将预先训练完成的初始深度学习模型中部分图节点的原始格式修改为预设格式;
将格式为所述预设格式的图节点的数据类型由浮点型数据转换成整型数据,以压缩所述初始深度学习模型。
为解决上述技术问题,本申请采用的第二个技术方案是:提供一种深度学习模型的压缩装置,该压缩装置包括:
格式转换模块,用于将预先训练完成的初始深度学习模型中部分图节点的原始格式修改为预设格式;
模型压缩模块,用于将格式为所述预设格式的图节点的数据类型由浮点型数据转换成整型数据,以压缩所述初始深度学习模型。
为解决上述技术问题,本申请采用的第三个技术方案是:提供一种深度学习模型的压缩设备,所述深度学习模型的压缩设备包括存储器和处理器;所述存储器用于存储实现如上所涉及的深度学习模型的压缩方法的程序指令;所述处理器用于执行所述存储器存储的所述程序指令。
为解决上述技术问题,本申请采用的第四个技术方案是:提供一种存储介质,所述存储介质存储有程序文件,所述程序文件能够被执行以实现如上所涉及的深度学习模型的压缩方法。
本申请提供一种深度学习模型的压缩方法、装置、设备及存储介质,该压缩方法将预先训练完成的初始深度学习模型中部分图节点的原始格式修改为预设格式,将格式为预设格式的图节点的数据类型由浮点型数据转换成整型数据,以对初始深度学习模型进行压缩;其中,由于该方法将初始深度模型中的部分图节点保存成了预设格式,不仅有效减小了模型中图节点的加载数量,大大减少了模型的体积,且节省了加载时间,使得运算速率有效提升;同时,通过将图节点的数据类型由浮点型数据转换成整型数据,大大减少了所需要消耗的运算资源,进一步提高了运算速度;另外,相比于对模型进行剪枝处理的方法,该方法不会对模型的预测效果产生影响。
附图说明
图1为本申请第一实施例提供的深度学习模型的压缩方法的具体流程示意图;
图2为本申请第二实施例提供的深度学习模型的压缩方法的具体流程示意图;
图3为本申请第三实施例提供的深度学习模型的压缩方法的具体流程示意图;
图4为本申请第四实施例提供的深度学习模型的压缩方法的具体流程示意图;
图5为本申请深度学习模型的压缩方法一具体实施方式的数据流向示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司,未经马上消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911144297.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种混凝土搅拌机的搅拌装置
- 下一篇:一种自动蓄电的移动式高效节能搅拌机