[发明专利]一种软硬件结合的视觉深度学习模型推理加速方法在审
申请号: | 202210817062.6 | 申请日: | 2022-07-12 |
公开(公告)号: | CN115034394A | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 刘丹;米金鹏;唐宋;包震伟 | 申请(专利权)人: | 上海理工大学 |
主分类号: | G06N5/04 | 分类号: | G06N5/04;G06N3/04;G06N3/08;G06T1/20 |
代理公司: | 上海邦德专利代理事务所(普通合伙) 31312 | 代理人: | 佘大鹏 |
地址: | 200093 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 软硬件 结合 视觉 深度 学习 模型 推理 加速 方法 | ||
1.一种软硬件结合的视觉深度学习模型推理加速方法,其特征在于,包括以下步骤:
S1、根据视觉任务,训练原始深度学习模型;
S2、针对所有网络层,利用权值大小挑选不重要的滤波器;
S3、移除当前层不重要滤波器,判断剪枝前后模型精度;
S4、进行判断模型精度下降是否明显;
S5、机型判断是否所有层处理完毕;
S6、进行全局优化网络,计算模型精度;
S7、模型部署TensorRT多线程处理。
2.如权利要求1所述的一种软硬件结合的视觉深度学习模型推理加速方法,其特征在于,步骤S4中当判断模型精度有所下降,此时返回步骤S3,当当判断模型精度没有下降,进行局部微调当前层,进行步骤S5。
3.如权利要求2所述的一种软硬件结合的视觉深度学习模型推理加速方法,其特征在于,步骤S5中当判断所有层处理完毕,则进行步骤S6,当判断所有层未处理完毕,则返回步骤S3。
4.如权利要求1所述的一种软硬件结合的视觉深度学习模型推理加速方法,其特征在于,步骤S6中每当计算模型的精度扔超过设定的阈值,则返回步骤S2。
5.如权利要求4所述的一种软硬件结合的视觉深度学习模型推理加速方法,其特征在于,步骤S2中针对模型每一层,对于任何一个滤波器fi,计算滤波器中所有权重绝对值之和,即wi=∑k|wk|,对该层网络所有的滤波器新权重wi进行排序,选择值最小的m个滤波器。
6.如权利要求5所述的一种软硬件结合的视觉深度学习模型推理加速方法,其特征在于,将当前网络层中选择的m个滤波器以及对应生成的特征图裁剪,比较裁剪前后网络模型的精度差值,如果精度下降幅度超过一定阈值,说明该层权重对整个模型学习过程比较重要,则跳过该层,即本层不进行裁剪操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海理工大学,未经上海理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210817062.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:污染源过程水质在线监测系统
- 下一篇:一种导电浆料用球形金粉的制备方法