[发明专利]网络模型训练方法、装置、设备及计算机可读存储介质在审
申请号: | 202010145962.1 | 申请日: | 2020-03-04 |
公开(公告)号: | CN111291868A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 王达;刘博;郑文琛;杨强 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 王韬 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 模型 训练 方法 装置 设备 计算机 可读 存储 介质 | ||
1.一种网络模型训练方法,其特征在于,所述网络模型训练方法包括以下步骤:
获取预设消息对应的训练数据以及验证数据;
通过深度神经子网络生成器生成多个候选子网络,并基于所述训练数据以及验证数据,确定各个候选子网络对应的训练误差;
基于各个所述训练误差,在各个候选子网络中确定最优子网络,并基于所述最优子网络以及主网络确定目标预测模型。
2.如权利要求1所述的网络模型训练方法,其特征在于,所述基于所述训练数据以及验证数据,确定各个候选子网络对应的训练误差的步骤包括:
依次在各个候选子网络获取目标候选子网络;
将所述目标候选子网络嵌入主网络得到更新后的主网络,并将所述训练数据以及验证数据输入更新后的主网络,以获得所述目标候选子网络对应的训练误差。
3.如权利要求2所述的网络模型训练方法,其特征在于,所述将所述训练数据以及验证数据输入更新后的主网络,以获得所述目标候选子网络对应的训练误差的步骤包括:
将所述训练数据以及验证数据输入更新后的主网络,并更新训练次数;
在所述训练次数达到预设训练次数时,将训练后的更新后的主网络,对应的训练误差作为所述目标候选子网络对应的训练误差;
在所述训练次数未达到预设训练次数时,将训练后的更新后的主网络作为更新后的主网络,并返回将所述训练数据以及验证数据输入更新后的主网络,并更新训练次数的步骤。
4.如权利要求1所述的网络模型训练方法,其特征在于,所述基于各个所述训练误差,在各个候选子网络中确定最优子网络的步骤包括:
获取各个候选子网络的网络层数对应的惩罚系数;
基于各个惩罚系数以及训练误差,分别确定各个候选子网络对应的权重分值;
将各个候选子网络中权重分值最小的候选子网络作为所述最优子网络。
5.如权利要求1所述的网络模型训练方法,其特征在于,所述网络模型训练方法还包括:
在通过深度神经子网络生成器生成多个候选子网络时,更新搜索次数;
所述基于所述最优子网络以及主网络确定所述目标预测模型的步骤包括:
确定所述最优子网络对应的训练误差是否小于所述主网络对应的训练误差;
若所述最优子网络对应的训练误差小于所述主网络对应的训练误差,则确定所述搜索次数是否达到预设搜索次数;
在所述搜索次数达到所述预设搜索次数时,则将所述最优子网络嵌入所述主网络以获得所述目标预测模型。
6.如权利要求5所述的网络模型训练方法,其特征在于,所述确定所述最优子网络对应的训练误差是否小于所述主网络对应的训练误差的步骤之后,还包括:
若所述最优子网络对应的训练误差大于或等于所述主网络对应的训练误差,则返回执行通过深度神经子网络生成器生成多个候选子网络的步骤。
7.如权利要求5所述的网络模型训练方法,其特征在于,所述确定所述搜索次数是否达到预设搜索次数的步骤之后,还包括:
在所述搜索次数未达到所述预设搜索次数时,则将所述最优子网络嵌入所述主网络;
将嵌入所述最优子网络后的主网络作为所述主网络,并返回执行通过深度神经子网络生成器生成多个候选子网络的步骤。
8.如权利要求1所述的网络模型训练方法,其特征在于,所述基于所述最优子网络以及主网络确定目标预测模型的步骤之后,所述网络模型训练方法还包括:
在确定目标预测模型之后的持续时长达到预设持续时长时,返回执行获取预设消息对应的训练数据以及验证数据的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010145962.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:光纤微振动的探测装置及系统
- 下一篇:一种硫酸钡锶垢生物除垢液及其除垢方法