[发明专利]一种复用深度神经网络模型训练模型的方法和系统在审
申请号: | 201910544437.4 | 申请日: | 2019-06-21 |
公开(公告)号: | CN110428051A | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | 段凌宇;陈子谦;楼燚航;黄铁军 | 申请(专利权)人: | 北京大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种复用深度神经网络模型训练模型的方法和系统。获取在其他数据集下训练好的深度神经网络模型作为复用模型;获取复用模型在给定任务数据集下的不同表层的信息特征并进行特征变换;获取待训练的深度神经网络模型在给定任务数据集下,针对数据集提取的信息特征,使用从复用模型提取的变换后的信息特征进行权重与尺度规约,并用于复用损失和待训练损失进行协同训练。本发明能够同时复用多个模型,且根据总损失使用反向传播训练和更新待训练模型,能够在数据集有无标签混合场景下以及在不同任务训练好的模型场景下,对模型进行较好的复用,提升复用模型的利用率以及模型复用的性能。 | ||
搜索关键词: | 复用 神经网络模型 复用模型 信息特征 训练模型 数据集 任务数据 规约 场景 标签混合 反向传播 特征变换 权重 尺度 协同 更新 申请 | ||
【主权项】:
1.一种复用深度神经网络模型训练模型的方法,其特征在于,包括:将数据集分别输入复用模型和待训练模型,得到复用特征、待训练特征和待训练模型损失;使用映射矩阵、复用特征和待训练特征计算复用模型和待训练模型之间的复用损失;使用待训练模型损失和复用损失计算总损失;根据总损失使用反向传播训练和更新待训练模型和映射矩阵。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910544437.4/,转载请声明来源钻瓜专利网。