[发明专利]一种面向物料识别的神经网络推理加速方法有效
申请号: | 202110549464.8 | 申请日: | 2021-05-20 |
公开(公告)号: | CN113222148B | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 孟文超;朱建新;徐金明;董超;陈军;陈雪超;林学忠 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06N5/04 | 分类号: | G06N5/04;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向物料识别的神经网络推理加速方法,解决了边缘端网络推理延迟严重的问题。首先,本发明创造性的运用余弦距离来判定量化前后的网络特征分布差异,从而确定不同层对量化到低比特的敏感性;运用混合精度量化将网络中对量化敏感的层量化到更高的比特。其次,针对物料识别网络划分方法受网络带宽影响较大的问题,本发明在传统的模型划分算法中加入正则化项,优先选取更低比特量化层作为划分点,降低推理受网络带宽的影响。最后,本发明面向混合精度量化和网络划分协同设计中,混合精度和划分点选取搜索空间大的问题,基于贪婪算法先根据网络精度要求确定混合精度量化方案,再选取总延时最少的划分点。 | ||
搜索关键词: | 一种 面向 物料 识别 神经网络 推理 加速 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110549464.8/,转载请声明来源钻瓜专利网。