[发明专利]经由偏置项在深度神经网络中纳入自顶向下信息在审
申请号: | 201680024211.6 | 申请日: | 2016-03-11 |
公开(公告)号: | CN107533665A | 公开(公告)日: | 2018-01-02 |
发明(设计)人: | R·B·托瓦 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N7/00 |
代理公司: | 上海专利商标事务所有限公司31100 | 代理人: | 李小芳,袁逸 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 经由 偏置 深度 神经网络 纳入 向下 信息 | ||
相关申请的交叉引用
本申请要求于2015年4月28日提交且题为“Incorporating top-down information in deep neural networks via the bias term(经由偏置项在深度神经网络中纳入自顶向下信息)”的美国临时专利申请No.62/154,097的权益,其公开内容通过援引全部明确纳入于此。
背景
领域
本公开的某些方面一般涉及神经系统工程,尤其涉及用于基于元素存在于去往网络的输入中的概率是否增大来调整该网络中的神经元的激活函数的偏置项以提高对该元素的敏感性的系统和方法。
背景技术
可包括一群互连的人工神经元(例如,神经元模型)的人工神经网络是一种计算设备或者表示将由计算设备执行的方法。
卷积神经网络是一种前馈人工神经网络。卷积神经网络可包括神经元集合,其中每一个神经元具有感受野并且共同地拼出一输入空间。卷积神经网络(CNN)具有众多应用。具体地,CNN已被广泛使用于模式识别和分类领域。
深度学习架构(诸如,深度置信网络和深度卷积网络)是分层神经网络架构,其中第一层神经元的输出变成第二层神经元的输入,第二层神经元的输出变成第三层神经元的输入,以此类推。深度神经网络可被训练以识别特征阶层并因此它们被越来越多地用于对象识别应用。类似于卷积神经网络,这些深度学习架构中的计算可分布在处理节点群体上,其可被配置在一个或多个计算链中。这些多层架构可每次训练一层并可使用反向传播微调。
其他模型也可用于对象识别。例如,支持向量机(SVM)是可被应用于分类的学习工具。支持向量机包括对数据进行归类的分离超平面(例如,决策边界)。该超平面由监督式学习来定义。期望的超平面增加训练数据的裕量。换言之,超平面应该具有到训练示例的最大的最小距离。
尽管这些解决方案在数个分类基准上取得了优异的结果,但它们的计算复杂度可能极其高。另外,模型的训练可能是有挑战性的。
概述
在本公开的一个方面,公开了一种对深度神经网络进行偏置的方法。该方法包括确定元素存在于去往该网络的输入中的概率是否增大。该方法还包括调整该网络中的神经元的激活函数的偏置以提高对该元素的敏感性。在一个配置中,该偏置是在不调整网络权重的情况下被调整的。该方法进一步包括至少部分地基于该偏置来调整该网络的输出。
本公开的另一方面涉及一种装备,其包括用于确定元素存在于去往网络的输入中的概率是否增大的装置。该装备还包括用于调整该网络中的神经元的激活函数的偏置以提高对该元素的敏感性的装置。在一个配置中,该偏置是在不调整网络权重的情况下被调整的。该装备进一步包括用于至少部分地基于该偏置来调整该网络的输出的装置。
在本公开的另一方面,公开了一种用于对深度神经网络进行偏置的计算机程序产品。该计算机程序产品具有其上记录有非瞬态程序代码的非瞬态计算机可读介质。该程序代码由处理器执行并且包括用于确定元素存在于去往该网络的输入中的概率是否增大的程序代码。该程序代码还包括用于调整该网络中的神经元的激活函数的偏置以提高对该元素的敏感性的程序代码。在一个配置中,该偏置是在不调整网络权重的情况下被调整的。该程序代码进一步包括用于至少部分地基于该偏置来调整该网络的输出的程序代码。
本公开的另一方面涉及一种用于对深度神经网络进行偏置的装置,该装置具有存储器单元和耦合至该存储器的一个或多个处理器。(诸)处理器被配置成确定元素存在于去往该网络的输入中的概率是否增大。(诸)处理器还被配置成调整该网络中的神经元的激活函数的偏置以提高对该元素的敏感性。在一个配置中,该偏置是在不调整网络权重的情况下被调整的。(诸)处理器被进一步配置成至少部分地基于该偏置来调整该网络的输出。
本公开的附加特征和优点将在下文描述。本领域技术人员应该领会,本公开可容易地被用作修改或设计用于实施与本公开相同的目的的其他结构的基础。本领域技术人员还应认识到,这样的等效构造并不脱离所附权利要求中所阐述的本公开的教导。被认为是本公开的特性的新颖特征在其组织和操作方法两方面连同进一步的目的和优点在结合附图来考虑以下描述时将被更好地理解。然而,要清楚理解的是,提供每一幅附图均仅用于解说和描述目的,且无意作为对本公开的限定的定义。
附图简述
在结合附图理解下面阐述的详细描述时,本公开的特征、本质和优点将变得更加明显,在附图中,相同附图标记始终作相应标识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680024211.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:通过分解的神经网络分类
- 下一篇:用于计算神经网络的节点值的硬件加速器和方法