[发明专利]用于确定表示DNN的层的值的定点数格式的方法和系统有效

申请号：	201811299719.4	申请日：	2018-11-02
公开（公告）号：	CN110009099B	公开（公告）日：	2021-12-24
发明（设计）人：	詹姆斯·因贝尔	申请（专利权）人：	畅想科技有限公司
主分类号：	G06N3/063	分类号：	G06N3/063;G06N3/04
代理公司：	北京东方亿思知识产权代理有限责任公司 11258	代理人：	林强
地址：	英国赫***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于确定表示 dnn 点数格式方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种确定用于表示深度神经网络DNN的一个或多个层的值的定点数格式的计算机实现的方法，所述DNN的一个或多个层中的每个层的值包括该层的权重和输入数据值中的至少一者，所述方法包括：

接收被配置为根据用于该层的一个或多个初始定点数格式表示一个或多个层的值的DNN的实例；

确定响应于测试输入数据的所述DNN的所述实例的输出；

确定所述DNN的所述实例的所述输出相对于基线输出的可微分误差；

使用泰勒近似来确定所述可微分误差中与所述一个或多个层中的每个层的值的量化相关的部分；以及

基于所述可微分误差中与所述一个或多个层中的每个层的值的量化相关的所述部分，调整所述一个或多个层中的至少一层的定点数格式。

2.根据权利要求1所述的方法，其中，具有最低权重量化误差部分和/或最低输入数据值量化误差部分的层的定点数格式被调整。

3.根据权利要求2所述的方法，其中，每个定点数格式包括指数和尾数位长度，并且调整定点数格式包括将定点数格式调整为具有下一最低尾数位长度的定点数格式。

4.根据权利要求1所述的方法，其中，具有最高权重量化误差部分和/或最高输入数据值量化误差部分的层的定点数格式被调整。

5.根据权利要求4所述的方法，其中，每个定点数格式包括指数和尾数位长度，并且调整定点数格式包括将定点数格式调整为具有下一最高尾数位长度的定点数格式。

6.根据权利要求1所述的方法，还包括：

在所述调整之后，确定响应于测试输入数据的所述DNN的所述实例的第二输出的准确度；以及

响应于确定所述DNN的所述实例的所述第二输出的所述准确度超过准确度阈值，执行以下操作：

确定所述DNN的所述实例的所述第二输出相对于基线输出的第二可微分误差；

使用泰勒近似来确定所述第二可微分误差中与所述一个或多个层中的每个层的值的量化相关的第二部分；

基于所述第二可微分误差中与所述一个或多个层中的每个层的值的量化相关的所述第二部分，调整所述一个或多个层中的至少一层的定点数格式。

7.根据权利要求6所述的方法，还包括：响应于确定所述DNN的所述实例的所述第二输出的所述准确度不超过所述准确度阈值，将所述调整丢弃。

8.根据权利要求6所述的方法，其中，所述DNN是分类网络，并且所述DNN的所述实例的所述第二输出的所述准确度是前1名的分类准确度或前5名的分类准确度。

9.根据权利要求1所述的方法，其中，使用泰勒近似来确定所述可微分误差中与所述一个或多个层中的每个层的值的量化相关的所述部分包括：

使用反向传播确定所述可微分误差关于值的斜率；以及

通过将特定值的量化误差乘以相应的斜率来计算所述可微分误差中可归因于该值的量化的所述部分。

10.根据权利要求9所述的方法，其中，确定所述可微分误差中与所述一个或多个层中的每个层的值的量化相关的所述部分还包括：通过对所述可微分误差中可归因于该层的权重的量化的部分求和来确定可归因于所述一个或多个层中的每个层的权重的量化的总误差，和/或通过对所述可微分误差中可归因于该层的输入数据值的量化的部分求和来确定可归因于所述一个或多个层中的每个层的输入数据值的量化的总误差。

11.根据权利要求1所述的方法，其中，所述DNN是分类网络，并且所述可微分误差是响应于测试输入数据的所述DNN的所述实例的所述输出的分对数与所述基线输出的分对数之间的绝对差的总和。

12.根据权利要求1所述的方法，其中，所述DNN是分类网络，并且所述可微分误差是响应于测试输入数据的所述DNN的所述实例的所述输出的柔性最大归一化分对数与所述基线输出的柔性最大归一化分对数之间的绝对差的总和。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于畅想科技有限公司，未经畅想科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811299719.4/1.html，转载请声明来源钻瓜专利网。

上一篇：一种光伏电池工作温度与发电功率联合估计方法
下一篇：自定义算子的计算方法及相关产品

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于确定表示DNN的层的值的定点数格式的方法和系统有效

专利文献下载