[发明专利]基于GPU的计算二值神经网络卷积的方法及装置有效
申请号: | 201611001971.3 | 申请日: | 2016-11-11 |
公开(公告)号: | CN106779057B | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 魏铭 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06F9/38;G06F9/305;G06F9/308 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 董巍;高伟 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供了一种基于GPU的计算二值神经网络卷积的处理方法,包括:获取根据二值神经网络执行卷积操作的计算请求;根据所述计算请求,开启GPU上的至少一个线程块,其中,每个线程块包括多个线程;基于两级分块策略,确定所述至少一个线程块中每个线程块的计算区域范围,并确定每个线程块所包括的线程的计算区域范围;所述至少一个线程块中的每个线程块内的各个线程执行计算过程,得到计算结果;根据每个线程块内的各个线程得到的所述计算结果,确定相应的线程块的输出结果。本发明设计了基于GPU线程块的两级分块策略,充分利用了GPU的访存特性,从而能够在GPU设备上实现二值神经网络卷积计算,并且计算速度得到了提升,内存消耗得到了减少。 | ||
搜索关键词: | 基于 gpu 计算 神经网络 卷积 方法 装置 | ||
【主权项】:
一种基于GPU的计算二值神经网络卷积的方法,其特征在于,包括:获取根据二值神经网络执行卷积操作的计算请求;根据所述计算请求,开启GPU上的至少一个线程块,其中,每个线程块包括多个线程;基于两级分块策略,确定所述至少一个线程块中每个线程块的计算区域范围,并确定每个线程块所包括的线程的计算区域范围;所述至少一个线程块中的每个线程块内的各个线程执行计算过程,得到计算结果;根据每个线程块内的各个线程得到的所述计算结果,确定相应的线程块的输出结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611001971.3/,转载请声明来源钻瓜专利网。