[发明专利]深度神经网络中的网络层运算方法及装置在审
申请号: | 201810679580.X | 申请日: | 2018-06-27 |
公开(公告)号: | CN110647974A | 公开(公告)日: | 2020-01-03 |
发明(设计)人: | 张渊;谢迪;浦世亮 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063;G06N3/08 |
代理公司: | 11413 北京柏杉松知识产权代理事务所(普通合伙) | 代理人: | 丁芸;项京 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 滤波器 网络层 卷积核 神经网络 线性组合 运算结果 卷积运算 输出数据 运算效率 求和 加权 卷积 位宽 运算 量化 申请 | ||
1.一种深度神经网络中的网络层运算方法,其特征在于,所述方法包括:
获取深度神经网络中网络层的权值张量,其中,所述权值张量包括多个滤波器;
针对所述网络层的各滤波器,将该滤波器拆分为多个定点卷积核的线性组合,其中,各所述定点卷积核中的权值为具有指定位宽的定点量化值;
针对所述网络层的各滤波器,将所述网络层的输入数据与该滤波器的各定点卷积核分别进行卷积运算,得到多个卷积结果,并根据该滤波器的多个定点卷积核的线性组合方式,将各卷积结果加权求和,得到该滤波器的运算结果;
确定各滤波器的运算结果组成所述网络层的输出数据。
2.根据权利要求1所述的方法,其特征在于,在所述针对所述网络层的各滤波器,将该滤波器拆分为多个定点卷积核的线性组合之前,所述方法还包括:
根据所述深度神经网络的预设应用精度,确定预设量化比特数;
所述针对所述网络层的各滤波器,将该滤波器拆分为多个定点卷积核的线性组合,包括:
针对所述网络层的各滤波器,根据所述预设量化比特数,将该滤波器拆分为多个定点卷积核的线性组合,其中,各所述定点卷积核对应的指定位宽之和等于所述预设量化比特数。
3.根据权利要求1或2所述的方法,其特征在于,所述网络层包括卷积层,所述卷积层的权值张量的大小为S×S×I×O;
所述针对所述网络层的各滤波器,将该滤波器拆分为多个定点卷积核的线性组合,包括:
针对所述卷积层的各滤波器,按照预设拆分公式,将该滤波器拆分为多个定点卷积核的线性组合,其中,所述预设拆分公式为:
所述wi为所述卷积层的第i个滤波器,所述i∈[1,O],所述p为对所述滤波器wi拆分后得到的定点卷积核的数量,所述αj为第j个定点卷积核的预设线性加权系数,所述tj为第j个定点卷积核,所述tj的大小为S×S×I,所述B为预设量化比特数,所述bj为第j个定点卷积核对应的指定位宽。
4.根据权利要求3所述的方法,其特征在于,所述根据该滤波器的多个定点卷积核的线性组合方式,将各卷积结果加权求和,得到该滤波器的运算结果,包括:
针对所述卷积层的各滤波器,按照该滤波器的各定点卷积核的预设线性加权系数,对各定点卷积核的卷积结果进行加权,并将各加权后的卷积结果相加,得到该滤波器的运算结果。
5.根据权利要求1或2所述的方法,其特征在于,所述网络层包括全连接层,所述全连接层的权值张量的大小为M×N,所述全连接层的各滤波器为大小为1×N的各向量;
所述针对所述网络层的各滤波器,将该滤波器拆分为多个定点卷积核的线性组合,包括:
针对所述全连接层的大小为1×N的各向量,按照预设拆分公式,将该向量拆分为多个定点卷积核的线性组合,其中,所述预设拆分公式为:
所述vx为所述全连接层的第x个大小为1×N的向量,所述x∈[1,M],所述q为对所述向量vx拆分后得到的定点卷积核的数量,所述βy为第y个定点卷积核的预设线性加权系数,所述ty为第y个定点卷积核,所述ty的大小为1×N,所述B为预设量化比特数,所述by为第y个定点卷积核对应的指定位宽。
6.根据权利要求5所述的方法,其特征在于,所述根据该滤波器的多个定点卷积核的线性组合方式,将各卷积结果加权求和,得到该滤波器的运算结果,包括:
针对所述全连接层的大小为1×N的各向量,根据该向量的各定点卷积核的预设线性加权系数,对各定点卷积核的卷积结果进行加权,并将各加权后的卷积结果相加,得到该向量的运算结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810679580.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:运算方法及相关方法和产品
- 下一篇:一种数据处理方法、装置、设备以及介质