[发明专利]信息处理设备、计算机可读存储介质和神经网络计算方法在审
申请号: | 202011343338.9 | 申请日: | 2020-11-25 |
公开(公告)号: | CN113111998A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 坂井靖文 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;崔俊红 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 设备 计算机 可读 存储 介质 神经网络 计算方法 | ||
1.一种执行神经网络的训练的信息处理设备,所述信息处理设备包括:
处理器;以及
由所述处理器访问的存储器,其中,
所述处理器:
根据具有第一位长度的第一定点数格式和定点数的最低有效位的第一指数信息,将通过所述训练的预定运算获得的多个第一中间数据分别量化为多个第一定点数的中间数据;
分别获得所述多个第一中间数据与所述多个第一定点数的中间数据之间的第一量化误差;
根据具有第二位长度的第二定点数格式和定点数的最低有效位的第二指数信息,将所述多个第一中间数据分别量化为多个第二定点数的中间数据;
分别获得所述多个第一中间数据与所述多个第二定点数的中间数据之间的第二量化误差;
将所述第一量化误差与所述第二量化误差进行比较,并将具有所述第一量化误差和所述第二量化误差中的较低量化误差的定点数格式确定为确定的定点数格式;并且
利用通过根据所述确定的定点数格式量化所述多个第一中间数据而获得的多个确定的定点数的中间数据来执行所述预定运算。
2.根据权利要求1所述的信息处理设备,其中,当由所述处理器通过舍入处理和饱和处理以所述位长度限制所述第一中间数据时,所述定点数格式限定数位的范围。
3.根据权利要求1所述的信息处理设备,其中,所述处理器还:
基于所述多个第一中间数据的值的范围,确定多个定点数格式候选,所述多个定点数格式候选每个分别具有针对所述最低有效位的指数信息的多个候选;
通过分别基于所述多个定点数格式候选对所述多个第一中间数据进行量化来生成多个经量化的中间数据,并且分别获得所述多个第一中间数据与所述多个经量化的中间数据之间的多个量化误差,所述多个量化误差分别与所述多个定点数格式候选相对应;以及
在确定所述确定的定点数格式时,将与所述多个量化误差中的最低量化误差相对应的定点数格式候选确定为所述确定的定点数格式。
4.根据权利要求3所述的信息处理设备,其中,在获得所述多个量化误差时,所述处理器从所述多个定点数格式候选中针对所述最低有效位的最大或最小指数信息的候选向针对所述最低有效位的最小或最大指数信息的候选依次计算所述多个量化误差,并且当所述多个量化误差之一从减小切换为增加时,结束所述多个量化误差的获得。
5.根据权利要求1所述的信息处理设备,其中,所述处理器在通过使用训练数据执行所述神经网络的训练的训练处理中,对所述确定的定点数格式执行确定。
6.根据权利要求1所述的信息处理设备,其中,在执行具有通过使用训练数据学习到的参数的神经网络的推断的推断处理时,执行对所述确定的定点数格式的确定。
7.根据权利要求1所述的信息处理设备,其中,所述处理器通过分别计算所述多个第一中间数据与多个经量化的中间数据之间的误差的平方之和或者通过分别计算所述多个第一中间数据与所述多个经量化的中间数据之间的差的绝对值之和,来计算所述第一量化误差和所述第二量化误差。
8.根据权利要求1所述的信息处理设备,其中,在根据定点数格式进行量化之前,所述多个第一中间数据是浮点数数据,或者是具有比在所述量化时使用的定点数格式的位长度长的位长度的定点数数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011343338.9/1.html,转载请声明来源钻瓜专利网。