[发明专利]被配置用于层和操作防护和依赖性管理的功率高效的深度神经网络处理器及方法有效
申请号: | 201880025488.X | 申请日: | 2018-04-13 |
公开(公告)号: | CN110537194B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | C·B·麦克布赖德;A·A·安巴德卡;K·D·塞多拉;G·彼得;L·M·瓦尔;B·博布罗夫 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06F9/48 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 赵林琳;郭星 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 配置 用于 操作 防护 依赖性 管理 功率 高效 深度 神经网络 处理器 方法 | ||
一种深度神经网络(DNN)处理器被配置为执行层描述符列表中的层描述符。描述符定义用于由DNN处理器执行DNN的前向传递的指令。层描述符也可以用于管理通过DNN模块的描述符流。例如,层描述符可以定义对其他描述符的依赖性。定义依赖性的描述符将不执行,直到它们所依赖的描述符已经完成。层描述符也可以定义“防护”或“屏障”功能,该功能可以用于阻止对上游层描述符的处理,直到所有下游层描述符的处理完成。防护位保证了在处理具有要声明的防护的层描述符之前,DNN处理流水线中没有其他层描述符。
背景技术
在诸如人脑的生物神经系统中,在信息处理和通信模式之后,对深度神经网络(“DNN”)进行松散建模。DNN可以用来解决复杂的分类问题,诸如但不限于对象检测、语义标记和特征提取。结果,DNN形成了很多人工智能(“AI”)应用的基础,诸如计算机视觉、语音识别和机器翻译。在很多领域,DNN都可以达到或甚至超过人类的准确性。
DNN的高级性能源于它们在对大数据集使用统计学习以获取输入空间的有效表示之后,从输入数据中提取高级特征的能力。但是,DNN的优越性能是以高计算复杂度为代价的。诸如图形处理单元(“GPU”)的高性能通用处理器通常用于提供很多DNN应用所需要的高水平计算性能。
尽管诸如GPU的通用处理器可以为实现DNN提供高水平的计算性能,但是这些类型的处理器通常不适合在低功耗至关重要的计算设备中长时间执行DNN操作。例如,诸如GPU的通用处理器可能不适合在电池供电的便携式设备(诸如智能手机或替代/虚拟现实(AR/VR)设备)中执行长时间运行的DNN任务,其中需要降低功耗以延长电池寿命。
在执行诸如人体移动的检测的连续DNN任务时,降低功耗在诸如以太网供电(“POE”)安全相机的非电池供电的设备中也很重要。在该特定示例中,POE交换机只能提供有限的电量,并且减少诸如安全相机的POE设备的功耗允许使用提供更少电量的POE交换机。
与通用处理器相比,已经开发出可以在降低功耗的同时提供高性能DNN处理的专用集成电路(“ASIC”)。尽管该领域取得了进步,但仍然需要提高执行DNN处理的ASIC的性能,并且降低执行DNN处理的ASIC的功耗,尤其是在低功耗至关重要的计算设备中。
关于这些和其他技术挑战,提出了本文中进行的公开内容。
发明内容
公开了一种神经网络模块或处理器,其可以以减少DNN计算执行期间的等待时间的方式,来执行层描述符列表中的层描述符(本文中可以称为“描述符”)。所公开的神经网络模块还可以实现用于管理通过DNN模块的描述符流的功能。通过所公开的技术的实现,可以优化通过DNN模块的描述符流,从而使得DNN模块能够更快地完成其处理。更快地完成处理可以使得DNN模块能够更早地关闭,从而节省了功率。还可以通过所公开的主题的实现来实现本文中未具体提及的其他技术益处。
为了实现上面简要提及的技术益处以及潜在的其他益处,公开了一种DNN模块,该DNN模块能够取回和执行层描述符列表中包含的描述符以实现DNN。层描述符列表(本文中可以称为“描述符列表”)由诸如编译器的软件预编译,并且包括用于由DNN模块执行神经网络的前向传递的指令。
描述符列表中的描述符也可以用来配置DNN模块的操作的各方面,包括用于实现神经网络的DNN模块中的神经元的配置。在一个实施例中,描述符列表存储在用作用于DNN模块的主机的计算设备的主存储器中,并且由DNN模块加载以进行即时执行。
描述符列表可以包括几种类型的DNN层描述符(本文中可以称为“描述符”):存储器到存储器移动(“M2M”)描述符;操作描述符;主机通信描述符;配置描述符;分支描述符;以及同步描述符。这些描述符类型中的每个的配置和操作将在下面详细描述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880025488.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:卷积神经网络的快速计算
- 下一篇:许可卡使用的方法及使用其的服务器