[发明专利]使用生成对抗模型基于预训练的模型生成数据在审
申请号: | 202180081646.5 | 申请日: | 2021-10-26 |
公开(公告)号: | CN116569180A | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 周旺;张阳;常十雨 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06N3/0475 | 分类号: | G06N3/0475;G06N3/094;G06F18/24;G06F18/214 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 生成 对抗 模型 基于 训练 数据 | ||
1.一种方法,包括:
接收分类器模型,所述分类器模型使用目标类别中的一个或多个数据样本而被训练;
训练生成对抗网络(GAN),以生成针对所述目标类别的模拟数据样本,包括:
使用生成器模型生成第一模拟数据样本;
通过使用判别器模型处理所述第一模拟数据样本来计算第一判别器损失;
通过使用所述分类器模型处理所述第一模拟数据样本来计算分类器损失;以及
基于所述第一判别器损失和所述分类器损失来细化所述生成器模型。
2.根据权利要求1所述的方法,其中所述GAN在不处理所述目标类别中的任何数据样本的情况下而被训练。
3.根据权利要求1所述的方法,其中训练所述GAN还包括:
使用所述生成器模型生成第二模拟数据样本;
通过使用所述判别器模型处理所述第二模拟数据样本来计算第二判别器损失;以及
基于所述第二判别器损失来细化所述判别器模型。
4.根据权利要求1所述的方法,其中所述判别器模型被训练以在由所述生成器模型生成的模拟数据样本与被用于训练所述分类器模型的数据样本之间进行区分。
5.根据权利要求1所述的方法,所述方法还包括:
通过向所述生成器模型提供随机化输入向量来生成针对所述目标类别的第一模拟数据样本。
6.根据权利要求5所述的方法,所述方法还包括:
至少部分地基于所述第一模拟数据样本,确定所述分类器模型利用所述目标类别中的不足的数据样本而被训练。
7.根据权利要求5所述的方法,所述方法还包括:
至少部分地基于所述第一模拟数据样本,确定被用于训练所述分类器模型的所述目标类别中的所述数据样本包括一个或多个可疑特征。
8.一个或多个计算机可读存储介质,共同包括计算机程序代码,所述计算机程序代码在由一个或多个计算机处理器的操作执行时执行操作,所述操作包括:
接收分类器模型,所述分类器模型使用目标类别中的一个或多个数据样本而被训练;
训练生成对抗网络(GAN),以生成针对所述目标类别的模拟数据样本,包括:
使用生成器模型生成第一模拟数据样本;
通过使用判别器模型处理所述第一模拟数据样本来计算第一判别器损失;
通过使用所述分类器模型处理所述第一模拟数据样本来计算分类器损失;以及
基于所述第一判别器损失和所述分类器损失来细化所述生成器模型。
9.根据权利要求8所述的计算机可读存储介质,其中所述GAN在不处理所述目标类别中的任何数据样本的情况下而被训练。
10.根据权利要求8所述的计算机可读存储介质,其中训练所述GAN还包括:
使用所述生成器模型生成第二模拟数据样本;
通过使用所述判别器模型处理所述第二模拟数据样本来计算第二判别器损失;以及
基于所述第二判别器损失来细化所述判别器模型。
11.根据权利要求8所述的计算机可读存储介质,其中所述判别器模型被训练以在由所述生成器模型生成的模拟数据样本与被用于训练所述分类器模型的数据样本之间进行区分。
12.根据权利要求8所述的计算机可读存储介质,所述操作还包括:
通过向所述生成器模型提供随机化输入向量来生成针对所述目标类别的第一模拟数据样本。
13.根据权利要求12所述的计算机可读存储介质,所述操作还包括:
至少部分地基于所述第一模拟数据样本,确定所述分类器模型利用所述目标类别中的不足的数据样本而被训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180081646.5/1.html,转载请声明来源钻瓜专利网。