[发明专利]使用按位运算的神经网络设备和方法在审
申请号: | 201910822391.8 | 申请日: | 2019-09-02 |
公开(公告)号: | CN111352656A | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 孙辰雨;孙昌用;李曙炯;郑相一;崔昌圭;韩在濬 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06N3/04;G06N3/08 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 刘灿强;张川绪 |
地址: | 韩国京畿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 运算 神经 网络设备 方法 | ||
公开一种使用按位运算的神经网络设备和方法。所述神经网络处理方法包括:获得与神经网络中的层的权重核的第一数据对应的核位串行块;基于所述层的一个或多个输入特征图的第二数据生成特征图位串行块;以及通过使用核位串行块与特征图位串行块之间的按位运算执行所述层的卷积运算来生成输出特征图的至少一部分。
本申请要求于2018年12月24日提交到韩国知识产权局的第10-2018-0168566号韩国专利申请的权益,所述韩国专利申请的全部公开出于所有目的通过引用包含于此。
技术领域
下面的描述涉及一种使用按位运算的神经网络设备和方法。
背景技术
例如,已经通过作为专门的计算架构的处理器实现的神经网络模型实现了识别的技术自动化,其中,在大量训练之后,处理器实现的神经网络模型可提供输入模式与输出模式之间的计算上直观的映射。产生这样的映射的训练能力可被称为神经网络的学习能力。此外,由于专门的训练,因此这样专门训练的神经网络可具有针对例如神经网络可能还未针对其进行训练的输入模式生成相对准确输出的泛化能力。
在神经网络用于对象识别的情况下,存在较大的存储器加载的次数和较大的操作的次数,这导致存储器空间和计算能量的低利用。
发明内容
提供本发明内容以简化的形式介绍在下面的具体实施方式中进一步描述的构思的选择。本发明内容不意在确定要求权利的主题的关键特征或必要特征,也不意在作为帮助确定要求权利的主题的范围而被使用。
在一个总体方面,一种处理器实现的神经网络处理方法包括:获得与神经网络中的层的权重核的第一数据对应的核位串行块;基于所述层的一个或多个输入特征图的第二数据生成特征图位串行块;以及通过使用核位串行块与特征图位串行块之间的按位运算执行所述层的卷积运算,生成输出特征图的至少一部分。
核位串行块和特征图位串行块可分别包括具有相同的位位置的位。
核位串行块可包括与权重核的核图的元素的多个位位置中的一个位位置对应的位,以及获得的步骤可包括:获得独立于核位串行块计算的其他核位串行块,其中,其他核位串行块均包括与所述多个位位置中的与所述多个位位置中的所述一个位位置不同的位位置对应的位。
所述多个位位置可包括最高有效位(MSB)至最低有效位(LSB)。
可通过交叉方法,分别沿权重核的通道方向从第一数据提取核位串行块,并且沿所述一个或多个输入特征图的通道方向从第二数据提取特征图位串行块,或者可通过平面方法,分别沿权重核的平面方向从第一数据提取核位串行块,并且沿所述一个或多个输入特征图中的两个或更多个的平面方向从第二数据提取特征图位串行块。
核位串行块和特征图位串行块可基于用于单指令多数据(SIMD)处理的参考位宽。
核位串行块和特征图位串行块中不满足参考位宽的空间可使用0填充。
参考位宽可以是32位、64位和128位中的任何一个。
按位运算可包括逻辑与(AND)运算和popcount运算。
核位串行块和特征图位串行块可具有相同的尺寸。
执行卷积运算的步骤可包括:在核位串行块与特征图位串行块之间执行逻辑AND运算;对逻辑AND运算的结果值执行popcount运算;以及基于popcount运算的结果值确定卷积运算的结果值。
确定卷积运算的结果值的步骤可包括:基于popcount运算的结果值执行位定位。
可基于第一数据的位位置来执行位定位。
第一数据和第二数据中的每个可由小于8位的位宽表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910822391.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:影像显示装置以及影像显示系统
- 下一篇:半导体存储器装置及其制造方法