[发明专利]神经网络模型训练方法及装置在审
申请号: | 201610320443.8 | 申请日: | 2016-05-16 |
公开(公告)号: | CN107392310A | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 张默 | 申请(专利权)人: | 北京陌上花科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 北京国昊天诚知识产权代理有限公司11315 | 代理人: | 许志勇 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 模型 训练 方法 装置 | ||
1.一种神经网络模型训练方法,其特征在于,包括:
获取训练样本;其中,所述训练样本包括输入数据以及与所述输入数据对应的标签数据;
随机生成神经网络模型的初始权重参数;
将所述初始权重参数进行三值化计算,获得三值化权重参数;
利用所述训练样本的输入数据以及所述三值化权重参数,计算输出数据;
判断所述输出数据与所述标签数据是否满足损失条件;
在所述输出数据与所述标签数据满足损失条件时,调整所述三值化权重参数;
利用所述训练样本的输入数据以及调整后的所述三值化权重参数;重新计算输出数据,返回所述将所述输出数据与所述标签数据进行比较,获取比较结果的步骤继续执行;
在所述输出数据与所述标签数据不满足损失条件时,将所述三值化权重参数作为所述神经网络模型的目标权重参数。
2.根据权利要求1所述方法,其特征在于,所述将所述初始权重参数进行三值化计算,获得三值化权重参数包括:
将所述初始权重参数中的每一个权重数据与权重阈值进行比较;
在所述权重数据大于所述权重阈值时,将所述权重数据三值化为数值1,在所述权重数据等于所述权重阈值时,将所述权重数据三值化为数值0,在所述权重数据小于所述权重阈值时,将所述权重数据三值化为数据-1,获得三值化权重参数。
3.根据权利要求1所述方法,其特征在于,所述将所述初始权重参数进行三值化计算,获得三值化权重参数包括:
将所述初始权重参数按照下述计算公式进行三值化计算;
其中,α≥0,wt∈{-1,0,1}
其中,w为所述初始权重参数,wt为三值化权重参数,α为比例因子,用于对wt进行归一化,J(w;α,wt)表示初始权重参数与三值化权重参数的欧式距离;
寻找比例因子,使得初始权重参数与三值化权重参数的欧式距离最小时,计算获得三值化权重参数;
其中,eps为权重阈值,wi为初始权重参数中的第i个权重数据。
4.根据权利要求1所述的方法,其特征在于,所述获取训练样本包括多组;
所述利用所述训练样本的输入数据以及所述三值化权重参数,计算输出数据包括:
利用一组训练样本中的输入数据以及所述三值化权重参数,计算输出数据;
所述利用所述训练样本的输入数据以及调整后的所述三值化权重参数;重新计算输出数据,返回所述将所述输出数据与所述标签数据进行比较,获取比较结果的步骤继续执行包括:
利用未进行训练的一组训练样本的输入数据以及调整后的所述三值化权重参数;重新计算输出数据,返回所述将所述输出数据与所述标签数据进行比较,获取比较结果的步骤继续执行。
5.根据权利要求1所述方法,其特征在于,所述判断所述输出数据与所述标签数据是否满足损失条件包括包括:
计算所述输出数据与所述标签数据的距离;
判断所述距离是否大于预设距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京陌上花科技有限公司,未经北京陌上花科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610320443.8/1.html,转载请声明来源钻瓜专利网。