[发明专利]针对二维阵列处理器的性能增强在审
申请号: | 201680042846.9 | 申请日: | 2016-07-23 |
公开(公告)号: | CN107851214A | 公开(公告)日: | 2018-03-27 |
发明(设计)人: | W·H·约翰逊;永田敏夫 | 申请(专利权)人: | 米雷普里卡技术有限责任公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06K9/00 |
代理公司: | 北京市中咨律师事务所11247 | 代理人: | 李永敏,杨晓光 |
地址: | 美国德*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 二维 阵列 处理器 性能 增强 | ||
技术领域
本申请要求于2015年7月23日提交的题为“Mireplica Visual-Processing Architecture:Convolutional Neural Networks”的申请号为62/195,921的美国临时申请的优先权,该申请的整体通过引用并入在此,并为了如在此完全和全面阐述的所有目的。
背景技术
许多应用程序涉及二维数据集合。视觉处理应用程序就是一个示例。在此使用的术语“视觉处理”涉及图像和视频图片元素(“像素”)和相关数据的一般处理类别。这包括诸如增强图像和转换像素格式、运动检测和跟踪,以及识别静止图像或视频帧中的特征或对象的应用程序。涉及可以以二维集合表示的数据的其它应用程序包括物理量(诸如力或电磁场)的建模。在一些情况下,三维数据集合可以以二维表示,诸如通过投影或变换到二维平面中,或者作为多个相邻的二维数据集合。
卷积神经网络包含大量的检测和分类算法。近来,二维(2D)卷积神经网络(CNN)由于其对大量图像对象的检测和分类的能力而受到广泛关注。CNN具有许多不同的配置,但该配置由基本元素组成,其通过调节网络参数和互连拓扑结构而允许网络“受训练”以识别对象,以实现高水平的检测可靠性,在现有实施方式中通常为超过90%。
CNN通常被分类为“深度”神经网络,通常具有四层或更多层。CNN的“卷积”层通常具有比输入更多的输出值,输出进而成为下一个卷积层的输入。如下面进一步讨论的,由此产生的运算的数量非常大,并且对一个输入图像帧执行检测处理所需的时钟周期的数量可以容易地在十亿的量级上。对于许多应用程序来说,实时图像识别是期望的,诸如自动操作车辆的签名读取或在安全情况下的面部识别。因此,检测速度的提高可以极大地提高这种图像识别应用程序的性能和能力。
附图说明
以下对各种公开实施例的详细描述参考了附图,在附图中:
图1是示出示例性卷积神经网络的某些方面的简化框图;
图2是示出在卷积神经网络中的卷积运算的图;
图3是示出与单个像素相关联的检测输出所依赖的图像、信号、权重和偏置元素的数量的图;
图4是示出瓦片(tile)处理器数据流实施方式的某些方面的简化框图;
图5是示出针对在示例性CNN检测处理的操作期间执行的数据请求的延迟的直方图;
图6是示出在一些实施例中与在此描述的瓦片处理器一起使用的指令生成单元的实施例的某些方面的简化框图;
图7是示出在卷积神经网络中的示例性子采样(subsampling)操作的图;
图8是示出示例性卷积神经网络中的子采样操作导致的数据矢量宽度的图;
图9是示出在采用子采样执行示例性卷积神经网络期间的瓦片处理器数据存储器存储的图;
图10是示出提供示例性卷积神经网络的改进的并行性(parallelism)和更快的执行的数据重组方案的图;
图11是示出在执行采用子采样和矢量级联(vector concatenation)的示例性卷积神经网络期间的瓦片处理器数据存储器存储的图;
图12是示出在不存在数据重组方案的情况下对示例性卷积运算的行和列输入的图;
图13是示出使用数据重组方案的示例性卷积运算的行和列输入的图;
图14是示出作为数据重组方案的一部分的数据的输入置乱(shuffling)的图;
图15是示出作为数据重组方案的一部分的数据的输入置乱的图;
图16是示出针对在利用数据重组的示例性CNN检测处理的操作期间执行的数据请求的延迟的直方图;
图17是示出用于示例性卷积神经网络的交错数据重组方案的图;
图18是示出作为数据重组方案的一部分的数据的输入置乱的图;以及
图19是示出针对在利用交错数据重组方案的示例性CNN检测处理的操作期间执行的数据请求的延迟的直方图。
具体实施方式
概述
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于米雷普里卡技术有限责任公司,未经米雷普里卡技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680042846.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种全景视频处理制作系统及方法
- 下一篇:一种基于无线控制的视频剪辑系统