[发明专利]一种模型训练的方法、数据生成的方法以及装置在审
申请号: | 202011567739.2 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112633385A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 刘智立;罗琪竣;洪蓝青;李崇轩;朱军;李震国 | 申请(专利权)人: | 华为技术有限公司;清华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 陈松浩 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 数据 生成 以及 装置 | ||
本申请公开了一种模型训练的方法,涉及人工智能领域,包括:根据未携带标签的源域数据、目标域有标签数据对目标模型进行迭代训练,其中,每次迭代训练,包括:将未携带标签的源域数据输入至第一生成模型,以输出第一生成结果。将源域数据未携带的标签和第一生成结果进行组合,以获取第一组合数据。将第一组合数据以及目标域有标签数据输入至第一判别模型中,以输出第一判别结果。根据第一判别结果获取第一损失值。固定第一生成模型的参数,根据第一损失值更新第一判别模型,或者固定第一判别模型的参数,根据第一损失值更新第一生成模型的参数。通过本申请提供的方案,可以根据源域的数据获取大量优质的目标域数据。
技术领域
本申请涉及人工智能技术领域,具体涉及一种模型训练的方法、数据生成的方法以及装置。
背景技术
人工智能(artificial intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
近些年来,在人工智能领域,使用领域自适应策略来解决图像分类、检测等任务成为热点。领域自适应是指利用数据、任务或模型之间的相似性,将在源领域学习过的模型,应用于目标领域的一种学习过程。通过源领域的数据生成大量优质的目标域数据,有利于根据获取到的大量优质的目标域数据训练获取性能更好的模型,因此如何根据源领域的数据生成大量优质的目标域数据亟待解决。
发明内容
本申请实施例提供一种模型训练的方法、数据生成的方法以及装置,以通过源领域的数据生成大量优质的目标域数据。
为达到上述目的,本申请实施例提供如下技术方案:
本申请第一方面提供一种模型训练的方法,可以包括:根据未携带标签的源域数据、目标域有标签数据对目标模型进行迭代训练,目标模型可以包括第一生成模型和第一判别模型。第一生成模型和第一判别模型可以是神经网络,例如:残差神经网络(residualneural network,Resnet),比如具体可以是Resnet50。第一生成模型和第一判别模型还可以是其他类型的神经网络,或者第一生成模型和第一判别模型还可以是VGG、AlexNet,或者第一生成模型和第一判别模型还可以是例如全连接网络,全连接网络的层数可以选择(例如但不限于:九层的全连接网络),或者第一生成模型和第一判别模型还可以是卷积神经网络。需要说明的是,第一生成模型和第一判别模型可以是相同类型的神经网络,比如二者都采用Resnet50;第一生成模型和第一判别模型也可以是不同类型的神经网络,比如第一生成模型采用Resnet50,第一判别模型采用AlexNet。本申请中的源域数据可以是图片数据、文本数据或者语音数据,本申请实施例对源域数据的类型并不进行限定。本申请中的目标域数据与源语数据的数据类型相同。其中,每次迭代训练,可以包括:将未携带标签的源域数据输入至第一生成模型,以输出第一生成结果。将源域数据未携带的标签和第一生成结果进行组合,以获取第一组合数据。以图片数据为例进行说明,假设源域数据包括图片1(标签为“猫”)。将图片1(不携带标签“猫”)输入至第一生成模型。针对图片1,第一生成模型生成1个生成图片,假设为生成图片1。将源域数据未携带的标签和第一生成结果进行组合,以获取第一组合数据,可以理解为,将生成图片1和图片1未携带的标签“猫”进行组合,以获取一组组合数据。将第一组合数据以及目标域有标签数据输入至第一判别模型中,以输出第一判别结果。目标域的数据包括有标签的数据和无标签的数据。需要说明的是,未携带标签的源域数据代表源域数据是有标签的,只是输入至第一生成模型中时没有携带,而目标域无标签的数据代表该目标域的数据是没有标签的。根据第一判别结果获取第一损失值。固定第一生成模型的参数,根据第一损失值更新第一判别模型,或者固定第一判别模型的参数,根据第一损失值更新第一生成模型。第一判别模型用于判别输入至第一判别模型的数据是真实的目标域数据还是第一生成器生成的数据。第一判别模型的训练目标为判别第一组合数据为负样本,判别目标域有标签数据为正样本。训练第一判别模型的目的在于,使第一判别模型可以更准确的判别获取到的数据哪些是生成器生成的数据,哪些是目标域有标签的数据。迭代训练的过程可以看做根据第一损失值对第一生成模型和第一判别模型进行对抗训练的训练过程。对抗训练是指第一生成模型和第一判别模型形成一种动态的“博弈过程”,相互对抗,相互促进。可以理解为,第一生成模型的训练是了使第一判别模型无法正确判断接收的数据是来自第一生成模型还是来自真实的目标域数据,第一判别模型的训练是为了准确分辨接收的数据是来自第一生成模型还是来自真实的目标域数据。重复执行上述迭代训练的过程,直至满足预设的停止条件,其中,停止条件包括但不限于满足预设的训练次数、第一生成模型满足收敛条件、第一判别模型无法正确判断接收的数据是来自第一生成模型还是来自真实的目标域数据。本申请提供的一种模型训练的方法,根据未携带标签的源域数据对目标模型进行迭代训练。使目标模型中的第一生成模型只能根据源域数据本身的特征生成第一生成结果。避免在生成第一生成的结果中,产生“标签主导”的问题,忽略了源域数据本身的特征,比如忽略了图片的语义信息。因此通过本申请提供的训练方法获取的模型,可以根据源域的数据获取大量优质的目标域数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;清华大学,未经华为技术有限公司;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011567739.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置