[发明专利]模型生成方法和装置有效

申请号：	201811534701.8	申请日：	2018-12-14
公开（公告）号：	CN109598344B	公开（公告）日：	2020-10-02
发明（设计）人：	胡耀全	申请（专利权）人：	北京字节跳动网络技术有限公司
主分类号：	G06N3/08	分类号：	G06N3/08
代理公司：	北京英赛嘉华知识产权代理有限责任公司 11204	代理人：	王达佐;马晓亚
地址：	100041 北京市石景山区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	模型生成方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开实施例公开了模型生成方法和装置。该方法的具体实施方式包括：获取训练样本数据；在基于该训练样本数据和待训练模型的前向传播过程中，利用第一精度类型的数据进行计算，得到第一精度类型的实际输出；在基于该实际输出和该待训练模型的反向传播过程中，利用第二精度类型的数据进行计算，其中，该第一精度类型和该第二精度类型不同。该实施方式提供了新的模型生成方式。

技术领域

本公开实施例涉及计算机技术领域，具体涉及模型生成方法和装置。

背景技术

随着人工智能的发展，基于神经网络的模型在越来越多的场景中发挥作用。神经网络可以指人工神经网络(Artificial Neural Network，ANN)。神经网络通常是一种运算模型，由大量的节点(或称神经元)之间相互连接构成。每个节点可以代表一种特定的输出函数，称为激励函数(activation function)。每两个节点间的连接都代表一个对于通过该连接信号的加权值，称之为权重，这相当于人工神经网络的记忆。

在对基于神经网络的模型的训练过程中，现有技术中通常采用一种精度类型的数据进行计算。

发明内容

本公开实施例提出了模型生成方法和装置。

第一方面，本公开实施例提供了一种模型生成方法，该方法包括：获取训练样本数据；在基于该训练样本数据和待训练模型的前向传播过程中，利用第一精度类型的数据进行计算，得到第一精度类型的实际输出；在基于该实际输出和该待训练模型的反向传播过程中，利用第二精度类型的数据进行计算，其中，该第一精度类型和该第二精度类型不同。

在一些实施例中，该第一精度类型或者第二精度类型为半精度类型。

在一些实施例中，该第一精度类型指示的精度小于该第二精度类型指示的精度。

在一些实施例中，该第一精度类型指示的精度大于该第二精度类型指示的精度。

在一些实施例中，该在基于该训练样本数据和待训练模型的前向传播过程中，利用第一精度类型的数据进行计算，得到第一精度类型的实际输出，包括：响应于确定该训练样本数据不是第一精度类型的数据，将该训练样本数据转换为第一精度类型的数据，生成第一训练样本数据；响应于确定待训练模型的网络参数不是第一精度类型的数据，将该网络参数转换为第一精度类型的数据，生成第一网络参数；利用该第一训练样本数据和该第一网络参数，进行前向传播计算，得到第一精度类型的实际输出。

在一些实施例中，上述在基于该实际输出和该待训练模型的反向传播过程中，利用第二精度类型的数据进行计算，包括：将该实际输出由第一精度类型转换为第二精度类型；响应于确定待训练模型的网络参数不是第二精度类型的数据，将该网络参数转换为第二精度类型的数据，生成第二网络参数；根据第二精度类型的实际输出和该第二网络参数，进行反向传播计算，以更新该第二网络参数。

第二方面，本公开实施例提供了一种模型生成装置，该装置包括：获取单元，被配置成获取训练样本数据；前向传播单元，被配置成在基于该训练样本数据和待训练模型的前向传播过程中，利用第一精度类型的数据进行计算，得到第一精度类型的实际输出；反向传播单元，被配置成在基于该实际输出和该待训练模型的反向传播过程中，利用第二精度类型的数据进行计算，其中，该第一精度类型和该第二精度类型不同。

在一些实施例中，该第一精度类型或者第二精度类型为半精度类型。

在一些实施例中，该第一精度类型指示的精度小于该第二精度类型指示的精度。

在一些实施例中，该第一精度类型指示的精度大于该第二精度类型指示的精度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司，未经北京字节跳动网络技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811534701.8/2.html，转载请声明来源钻瓜专利网。

上一篇：一种深度神经网络的记忆方法及计算机设备
下一篇：具有对象年龄特征膜计算的桥式吊车神经网络建模方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]模型生成方法和装置有效

专利文献下载