[发明专利]LSTM模型优化方法、加速器、装置及介质在审
申请号: | 202110770411.9 | 申请日: | 2021-07-07 |
公开(公告)号: | CN113537465A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 宋朝忠;李小莲;连帅军 | 申请(专利权)人: | 深圳市易成自动驾驶技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063;G06N3/08 |
代理公司: | 深圳市恒程创新知识产权代理有限公司 44542 | 代理人: | 王启蒙 |
地址: | 518057 广东省深圳市南山区西丽街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | lstm 模型 优化 方法 加速器 装置 介质 | ||
1.一种LSTM模型优化方法,其特征在于,所述方法包括:
获取剪枝后的LSTM网络的权重矩阵;
基于所述权重矩阵,获取所述权重矩阵的权值稀疏度;
获取输入序列的稀疏度;
基于所述权值稀疏度以及所述输入序列的稀疏度,对运算模式进行判断;
若所述运算模式判定为稀疏运算模式,则对所述输入序列按照所述稀疏运算模式进行计算。
2.如权利要求1所述的LSTM模型优化方法,其特征在于,所述基于所述权值稀疏度以及所述输入序列的稀疏度,对运算模式进行判断,包括:
若所述权值稀疏度大于或者等于权值稀疏度阈值和/或所述输入序列的稀疏度大于或者等于输入序列稀疏度阈值,则判定为所述稀疏运算模式。
3.如权利要求1所述的LSTM模型优化方法,其特征在于,所述对所述输入序列按照所述稀疏运算模式进行计算,包括:
对所述权重矩阵进行平衡调整;
将所述输入序列与调整后的权重矩阵进行乘法计算。
4.如权利要求3所述的LSTM模型优化方法,其特征在于,所述对所述权重矩阵进行平衡调整,包括:
统计所述权重矩阵中有效权重的个数;
将所述有效权重的个数除以所述权重矩阵的行数,获得每行的有效权重平均数;
基于所述有效权重平均数,调整所述权重矩阵每行的有效权重个数。
5.如权利要求1所述的LSTM模型优化方法,其特征在于,所述获取输入序列的稀疏度,包括:
对预设数量个运算周期内的输入序列的零值个数或者连续零值个数执行零值检测,获得输入序列的稀疏度。
6.如权利要求1所述的LSTM模型优化方法,其特征在于,所述基于所述权值系数度以及所述输入序列的稀疏度,对运算模式进行判断,还包括:
若所述权值稀疏度小于权值稀疏度阈值和/或所述输入序列的稀疏度小于输入序列稀疏度阈值,则判定为密集运算模式;
其中,在所述判定为密集运算模式的步骤之后,还包括:
若所述运算模式判定为密集运算模式,则对所述输入序列按照所述密集运算模式进行计算。
7.如权利要求6所述的LSTM模型优化方法,其特征在于,所述对所述输入序列按照所述密集运算模式进行计算,包括:
基于输入序列的向量维度数以及LSTM网络隐藏层的节点数,将所述输入序列进行多次分块,生成多个分块向量;
将所述多个分块向量,按照流水线控制方式进行并行计算。
8.一种LSTM模型优化装置,其特征在于,所述装置包括:
获取数据模块,用于获取剪枝后的LSTM网络的权重矩阵;基于所述权重矩阵,获取所述权重矩阵的权值稀疏度;获取输入序列的稀疏度;
运算模式判断模块,用于基于所述权值稀疏度以及所述输入序列的稀疏度,对运算模式进行判断;
计算模块,用于若所述运算模式判定为稀疏运算模式,则对所述输入序列按照所述稀疏运算模式进行计算。
9.一种LSTM硬件加速器,其特征在于,包括存储器,处理器及存储在所述存储器上并可在所述处理器上运行的LSTM模型优化方法程序,所述处理器执行所述LSTM模型优化方法程序时实现权利要求1-8任一所述的LSTM模型优化方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有LSTM模型优化方法程序,所述LSTM模型优化方法程序被处理器执行时实现权利要求1-8任一所述的LSTM模型优化方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市易成自动驾驶技术有限公司,未经深圳市易成自动驾驶技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110770411.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于网络安全的隔离装置及其方法
- 下一篇:电缆摩擦试验机