[发明专利]一种模型迁移训练方法、装置、设备及存储介质在审
申请号: | 202010219449.2 | 申请日: | 2020-03-25 |
公开(公告)号: | CN111444958A | 公开(公告)日: | 2020-07-24 |
发明(设计)人: | 卢阳 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 迁移 训练 方法 装置 设备 存储 介质 | ||
1.一种模型迁移训练方法,其特征在于,包括:
将源模型中至少两个迁移层的网络参数作为目标模型中关联的迁移层的初始参数;
根据所述至少两个迁移层关联的训练参数与所述初始参数之间的距离,构建目标函数;
基于所述目标函数,对包括有初始参数的目标模型进行训练。
2.根据权利要求1所述的方法,其特征在于,根据所述至少两个迁移层关联的训练参数与所述初始参数之间的距离,构建目标函数,包括:
根据所述至少两个迁移层的权重,以及所述至少两个迁移层关联的训练参数与所述初始参数之间的距离,构建目标函数。
3.根据权利要求2所述的方法,其特征在于,根据所述至少两个迁移层的权重,以及所述至少两个迁移层关联的训练参数与所述初始参数之间的距离,构建目标函数之前,还包括:
根据所述迁移层在模型中的网络层级信息,确定所述迁移层的权重。
4.根据权利要求3所述的方法,其特征在于,根据所述迁移层在模型中的网络层级信息,确定所述迁移层的权重,包括:
确定所述迁移层所属网络块的序号;
根据所述迁移层所属网络块的序号,确定所述迁移层的权重。
5.根据权利要求4所述的方法,其特征在于,根据所述迁移层所属网络块的序号,确定所述迁移层的权重,包括:
基于权重函数,根据所述迁移层所属网络块的序号,确定所述迁移层的权重;其中,所述权重函数为所述网络块的序号的递减函数。
6.根据权利要求2所述的方法,其特征在于,根据所述至少两个迁移层的权重,以及所述至少两个迁移层关联的训练参数与所述初始参数之间的距离,构建目标函数,包括:
根据各所述迁移层的训练参数与所述初始参数之间距离的加权和,确定迁移层的规则化项;
根据所述迁移层的规则化项和损失函数,构建所述目标函数。
7.根据权利要求6所述的方法,其特征在于,根据所述迁移层的规则化项和损失函数,构建所述目标函数,包括:
根据全连接层的训练参数,确定所述全连接层的规则化项;
根据所述迁移层的规则化项、所述全连接层的规则化项和损失函数,构建所述目标函数。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述迁移层为图像特征提取层。
9.一种模型迁移训练装置,其特征在于,包括:
初始参数确定模块,用于将源模型中至少两个迁移层的网络参数作为目标模型中关联的迁移层的初始参数;
目标函数构建模块,用于根据所述至少两个迁移层关联的训练参数与所述初始参数之间的距离,构建目标函数;
目标模型训练模块,用于基于所述目标函数,对包括有初始参数的目标模型进行训练。
10.根据权利要求9所述的装置,其特征在于,目标函数构建模块,包括:
目标函数构建单元,用于根据所述至少两个迁移层的权重,以及所述至少两个迁移层关联的训练参数与所述初始参数之间的距离,构建目标函数。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
权重确定模块,用于在根据所述至少两个迁移层的权重,以及所述至少两个迁移层关联的训练参数与所述初始参数之间的距离,构建目标函数之前,根据所述迁移层在模型中的网络层级信息,确定所述迁移层的权重。
12.根据权利要求11所述的装置,其特征在于,权重确定模块,包括:
网络块序号确定单元,用于确定所述迁移层所属网络块的序号;
迁移层权重确定单元,用于根据所述迁移层所属网络块的序号,确定所述迁移层的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010219449.2/1.html,转载请声明来源钻瓜专利网。