[发明专利]使用激活数据的压缩和解压缩来减少存储器带宽利用率的神经网络处理器有效
申请号: | 201880025420.1 | 申请日: | 2018-04-16 |
公开(公告)号: | CN110520909B | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | J·L·科克里;B·E·伦德尔;L·M·瓦尔;C·B·麦克布赖德;A·A·安巴德卡;G·彼得;K·D·塞多拉;B·博布罗夫 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G08B13/196 | 分类号: | G08B13/196;G06N3/063;H03M7/30;H03M7/46 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 董莘 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 激活 数据 压缩 和解 减少 存储器 带宽 利用率 神经网络 处理器 | ||
深度神经网络(“DNN”)模块可以压缩和解压缩神经元生成的激活数据,以减少存储器总线带宽的利用率。压缩单元可以接收由DNN模块中的神经元生成的未压缩数据块。压缩单元生成压缩输出块的掩码部分和数据部分。掩码部分对未压缩数据块中的零字节和非零字节的存在和位置进行编码。数据部分存储来自未压缩数据块的截断的非零字节。解压缩单元可以从DNN处理器中的存储器或应用主机的存储器中接收压缩数据块。解压缩单元使用掩码部分和数据部分对压缩数据块进行解压缩。这可以减少存储器总线利用率,允许DNN模块更快地完成处理操作,并降低功耗。
背景技术
在诸如人脑的生物神经系统中的信息处理和通信模式之后,对深度神经网络(“DNN”)进行松散建模。DNN可以被利用来解决复杂的分类问题,诸如但不限于对象检测、语义标记和特征提取。结果,DNN形成了用于诸如计算机视觉、语音标识和机器翻译之类的许多人工智能(“AI”)应用的基础。DNN在这些领域中的许多领域中都可以匹配甚至超过人类的准确性。
DNN的高级性能源于它们在对大数据集使用统计学习以获得输入空间的有效表示之后从输入数据中提取高级特征的能力。但是,DNN的卓越性能是以高计算复杂度为代价的。诸如图形处理单元(“GPU”)之类的高性能通用处理器通常被利用来提供许多DNN应用所需的高水平计算性能。
尽管像GPU之类的通用处理器可以为实现DNN提供高水平的计算性能,但是这些类型的处理器通常不适合在低功耗至关重要的计算设备中长时间执行DNN操作时使用。例如,诸如GPU之类的通用处理器可能不适合在像智能电话或交替/虚拟现实(AR/VR)设备之类的电池供电的便携式设备中执行长时间运行的DNN任务时使用,其中需要降低功耗以延长电池寿命。
在执行诸如人体移动的检测之类的连续DNN任务时,降低功耗在诸如以太网供电(“POE”)安全相机之类的非电池供电的设备中也很重要。在该特定示例中,POE交换机只能提供有限的电量,并且降低如安全相机之类的POE设备的功耗允许使用提供更少功率的POE交换机。
已经开发出可以提供高性能DNN处理、同时与通用处理器相比降低了功耗的专用集成电路(“ASIC”)。但是,尽管在该领域取得了进步,但仍然需要提高执行DNN处理的ASIC的性能并降低其功耗,尤其是对于在低功耗至关重要的计算设备中使用。
关于这些和其他技术挑战,提出了本文进行的公开。
发明内容
公开了一种DNN模块或处理器,其可以压缩和解压缩激活数据以减少存储器总线带宽的利用率。特别地,DNN模块可以利用压缩来减少神经元输出与板载(on-board)存储器或非板载(off-board)存储器之间的总线带宽的利用率。DNN模块还可以利用解压缩来减少板载存储器或非板载存储器与神经元输入之间的存储器总线带宽的利用率。减少的带宽利用率可以使得能够加快处理,并且因此还可以降低功耗。还可以通过所公开的主题的实现来实现本文未具体提及的其他技术益处。
为了实现上面简要提及的技术益处,公开了一种DNN处理器,其包括一个或多个神经元和压缩单元。压缩单元可以接收由一个或多个神经元生成的未压缩数据块。在一些实施例中,未压缩数据块包括固定数目的字节,诸如64个字节。
为了对未压缩数据块进行压缩,压缩单元可以生成压缩输出块的掩码部分和数据部分。压缩输出块的掩码部分包括与未压缩数据块中的字节的固定数目相等的数目的比特。例如,如果未压缩数据块包括64个字节的数据,则掩码部分将包括64个比特(即8个字节)。
在一些实施例中,压缩输出块的掩码部分中的每个比特对应于未压缩数据块中的一个字节。例如,掩码部分的比特一可以对应于未压缩数据块中的第一个字节,掩码部分的比特二可以对应于未压缩数据块中的第二个字节,依此类推。在其他实施例中,压缩输出块的掩码部分中的两个或更多比特对应于未压缩数据块中的一个字节。在这些实施例中,压缩输出块的掩码部分中的比特不仅可以指示未压缩块中的对应字节,还可以指示其近似量级。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880025420.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:输入设备、自动柜员机和方法
- 下一篇:防盗装置以及防盗系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置