[发明专利]基于神经网络的计算方法及装置有效
申请号: | 201610340203.4 | 申请日: | 2016-05-19 |
公开(公告)号: | CN107402905B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 周舒畅;毛慧子;周昕宇;吴育昕;印奇 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06N3/04 |
代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰;张玮 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 计算方法 装置 | ||
本发明的实施例提供了基于神经网络的计算方法和装置。该方法包括:将输入数据输入至第一神经网络,其至少一个权重系数矩阵的至少一行内包括相同参数;基于第一神经网络对输入数据进行计算,其中在涉及权重系数矩阵的至少一行的矩阵乘法操作中,将矩阵乘法操作所涉及的输入矢量中的、与相同参数对应的元素相加,以获得元素和;将元素和与相同参数的值相乘,以获得数据积;根据数据积的加和计算涉及权重系数矩阵的至少一行的乘法计算结果;以及根据权重系数矩阵的所有行的乘法计算结果,计算并输出第一神经网络的计算结果。上述方法和装置能够显著减少基于神经网络的计算的计算量。
技术领域
本发明涉及人工智能领域,更具体地涉及一种基于神经网络的计算方法和装置。
背景技术
随着人工智能的快速发展,基于神经网络的计算已被广泛用于文字识别、语音识别等诸多领域中。在基于神经网络的计算中,一种典型的操作是输入矢量与参数矩阵的矩阵乘法。现有的神经网络的参数一般数目巨大,甚至多达几百亿。并且,这些参数一般由32位浮点数组成。
因此,现有的基于神经网络的计算通常计算量大,且耗时长。尤其在诸如手机的移动终端等计算能力受限的平台上,以上计算不但造成长延时,并给平台的功耗、散热等方面带来挑战。
发明内容
考虑到上述问题而提出了本发明。本发明提供了一种基于神经网络的计算方法和装置,通过合并神经网络中相同参数的乘法运算,可以显著减少基于神经网络的计算的计算量,从而提高计算速度,节约平台的能源。
根据本发明一方面,提供了一种基于神经网络的计算方法,包括:
将输入数据输入至第一神经网络,其中所述第一神经网络的至少一个权重系数矩阵的至少一行内包括相同参数;
基于所述第一神经网络对所述输入数据进行计算,其中在涉及所述权重系数矩阵的至少一行的矩阵乘法操作中,
将所述矩阵乘法操作所涉及的输入矢量中的、与所述相同参数对应的元素相加,以获得元素和;
将所述元素和与所述相同参数的值相乘,以获得数据积;
根据所述数据积的加和计算涉及所述权重系数矩阵的至少一行的乘法计算结果;以及
根据所述权重系数矩阵的所有行的乘法计算结果,计算并输出所述第一神经网络的计算结果。
示例性地,所述计算方法还包括:
将第二神经网络的至少一个权重系数矩阵的至少一行内的参数聚类;
根据经聚类的参数确定至少一个类中的每类的类中心值;以及
用所述类中心值替换对应类中的参数,以获得所述第一神经网络。
示例性地,所述确定至少一个类中的每类的类中心值包括:
计算所述至少一个类中的每类的参数的平均值,其中所述平均值是对应类的类中心值。
示例性地,所述确定至少一个类中的每类的类中心值包括:
计算所述至少一个类中的每类的参数的平均值;以及
将所述平均值取整;
其中,经取整的平均值是对应类的类中心值。
示例性地,所述聚类采用K均值聚类。
示例性地,所述计算方法还包括:
利用训练数据和与之对应的标注内容训练并获得所述第二神经网络。
示例性地,所述计算方法是利用代码生成器所生成的代码实现的。
根据本发明另一方面,还提供了一种基于神经网络的计算装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610340203.4/2.html,转载请声明来源钻瓜专利网。