[发明专利]具有回调的卷积矩阵相乘以用于深度卷积神经网络的深度瓦片化在审
申请号: | 201580075905.8 | 申请日: | 2015-12-09 |
公开(公告)号: | CN107209871A | 公开(公告)日: | 2017-09-26 |
发明(设计)人: | D·H·F·德克曼;M·巴丁 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 上海专利商标事务所有限公司31100 | 代理人: | 周敏,陈炜 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具有 卷积 矩阵 相乘 用于 深度 神经网络 瓦片 | ||
1.一种进行图像和滤波器到虚拟矩阵的地址转译以通过矩阵乘法执行卷积的方法,包括:
接收图像和滤波器,其各自具有存储器地址;
至少部分地基于所计算的经线性化图像和所计算的经线性化滤波器将所述存储器地址映射到虚拟矩阵地址;
将所述虚拟矩阵中的数据转换成预定义内部格式;以及
至少部分地基于所述虚拟矩阵地址通过所述预定义内部格式的所述数据的矩阵乘法来卷积所述图像。
2.如权利要求1所述的方法,其特征在于,进一步包括,在完成所述卷积之前将高速缓存中的经卷积图像的一部分声明为完成。
3.如权利要求2所述的方法,其特征在于,进一步包括:
由DCN的多个层处理来自所述高速缓存的经卷积图像的每一个部分以创建针对每一个部分的输出;
将每一个部分的所述输出聚集到聚集输出中;以及
由多个其余层处理所述聚集输出。
4.一种进行图像和滤波器到虚拟矩阵的转译以通过矩阵乘法执行卷积的装置,所述装置包括:
存储器;以及
耦合至所述存储器的至少一个处理器,所述至少一个处理器被配置成:
接收图像和滤波器,其各自具有存储器地址;
至少部分地基于所计算的经线性化图像和所计算的经线性化滤波器将所述存储器地址映射到虚拟矩阵地址;
将所述虚拟矩阵中的数据转换成预定义内部格式;以及
至少部分地基于所述虚拟矩阵地址通过所述预定义内部格式的所述数据的矩阵乘法来卷积所述图像。
5.如权利要求4所述的装置,其特征在于,所述至少一个处理器被进一步配置成在完成所述卷积之前将高速缓存中的经卷积图像的一部分声明为完成。
6.如权利要求5所述的装置,其特征在于,所述至少一个处理器被进一步配置成:
由DCN的多个层处理来自所述高速缓存的经卷积图像的每一个部分以创建针对每一个部分的输出;
将每一个部分的所述输出聚集到聚集输出中;以及
由多个其余层处理所述聚集输出。
7.一种由深度卷积网络(DCN)处理输入源的方法,所述方法包括:
由所述DCN的多个层一次一个部分地处理所述输入源以创建针对每一个部分的输出;
将每一个部分的所述输出聚集到聚集输出中;以及
由多个其余层处理所述聚集输出。
8.如权利要求7所述的方法,其特征在于,所述部分包括瓦片。
9.如权利要求7所述的方法,其特征在于,所述输入源包括图像。
10.如权利要求7所述的方法,其特征在于,进一步包括,将每一个部分的所述输出存储在高速缓存存储器中。
11.如权利要求7所述的方法,其特征在于,进一步包括,选择每一个部分的大小以纳入在预定存储器大小内,从而每一个部分的所述输出纳入在所述预定存储器大小内。
12.一种由深度卷积网络(DCN)处理输入源的装置,所述装置包括:
存储器;以及
耦合至所述存储器的至少一个处理器,所述至少一个处理器被配置成:
由所述DCN的多个层一次一个部分地处理所述输入源以创建针对每一个部分的输出;
将每一个部分的所述输出聚集到聚集输出中;以及
由多个其余层处理所述聚集输出。
13.如权利要求12所述的装置,其特征在于,所述部分包括瓦片。
14.如权利要求12所述的装置,其特征在于,所述输入源包括图像。
15.如权利要求12所述的装置,其特征在于,进一步包括,将每一个部分的所述输出存储在高速缓存存储器中。
16.如权利要求12所述的装置,其特征在于,所述至少一个处理器被进一步配置成选择每一个部分的大小以纳入在预定存储器大小内,从而每一个部分的所述输出纳入在所述预定存储器大小内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580075905.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:太阳能电池组件的环境温度巡查装置
- 下一篇:一种确定环境参数的方法和装置