[发明专利]一种计算装置及相关产品在审
申请号: | 201811507488.1 | 申请日: | 2018-12-10 |
公开(公告)号: | CN111291871A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
主分类号: | G06N3/06 | 分类号: | G06N3/06;G06N3/063 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 计算 装置 相关 产品 | ||
本申请提供了一种计算装置及相关产品,所述计算装置包括负载均衡单元、运算单元以及控制器单元;其中,控制器单元,用于获取针对第一输入数据的剪枝请求,并根据所述剪枝请求指示所述负载均衡单元对所述第一输入数据进行剪枝;其中,所述第一输入数据包括第一权值数据;负载均衡单元,用于将第一权值数据调整为第二权值数据;控制器单元,还用于根据第二输入数据以及计算指令执行神经网络计算。通过本申请,解决了因稀疏性问题带来的每个神经元的运算量不同而出现的负载不均衡的问题,提高了运算速度。
技术领域
本申请涉及信息处理技术领域,具体涉及一种计算装置及相关产品。
背景技术
神经网络是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型,这种网络由大量的节点(或称神经元)之间星湖连接构成,通过调整内部大量节点之间相互连接的关系,利用输入神经元数据、权值产生输出数据模拟人脑的信息处理过程处理信息并生成模式识别之后的结果。
目前,神经网络被广泛应用在计算机视觉的各个领域,如图像识别、物体检测、图像分割等。然而,在实际应用中,神经网络模型往往有着数量庞大的模型参数(例如,超大规模权值),在这种情况下,这意味着神经网络需要大量的计算资源和存储资源,大量的计算资源和存储资源的开销会降低神经网络的运算速度,对硬件的传输带宽以及运算器的要求也大大提高了,因此,如何在减少神经网络模型的参数的同时,降低神经网络的计算量变得十分重要。
现有技术中,通过剪枝方法对神经网络模型的参数进行调整,以减少神经网络模型的参数以及降低神经网络的计算量。但是,在对神经网络模型进行剪枝的过程中,容易导致神经网络模型出现稀疏性问题。上述稀疏性问题会引入不规则性,将原有规则的拓扑结构变得不规则,导致每个输出神经元的运算量不同,进而出现负载不均衡的问题。
发明内容
本申请实施例提供了一种计算装置及相关产品,解决了因稀疏性问题带来的每个神经元的运算量不同而出现的负载不均衡的问题,提高了运算速度。
第一方面,提供一种计算装置,所述计算装置用于执行机器学习模型机器学习计算,所述计算装置包括:负载均衡单元、运算单元以及控制器单元;
所述控制器单元,用于获取针对第一输入数据的剪枝请求,并根据所述剪枝请求指示所述负载均衡单元对所述第一输入数据进行剪枝;其中,所述第一输入数据包括第一权值数据;;
所述负载均衡单元,用于将所述第一权值数据调整为第二权值数据;
所述控制器单元,还用于获取第二输入数据以及计算指令;所述第二输入数据包括所述第二权值数据以及输入神经元数据;
所述控制器单元,还用于解析该计算指令得到多个运算指令,将所述多个运算指令以及所述第二输入数据发送给运算单元;
所述运算单元获取所述运算指令,并根据所述运算指令以及所述第二输入数据执行神经网络计算。
通过本申请,可以通过负载均衡单元将第一权值数据剪枝得到第二权值数据,继而可以根据第二权值数据以及输入神经元数据执行神经网络计算,解决了因稀疏性问题带来的每个神经元的运算量不同而出现的负载不均衡的问题,可以提高运算速度。
第二方面,本申请实施例提供了一种机器学习运算装置,该机器学习运算装置包括一个或者多个第一方面所述的计算装置。该机器学习运算装置用于从其他处理装置中获取待运算数据和控制信息,并执行指定的机器学习运算,将执行结果通过I/O接口传递给其他处理装置;
当所述机器学习运算装置包含多个所述计算装置时,所述多个所述计算装置间可以通过特定的结构进行链接并传输数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811507488.1/2.html,转载请声明来源钻瓜专利网。