[发明专利]用于图像分类器训练的数据扩充在审

专利信息
申请号: 202210585456.3 申请日: 2022-05-27
公开(公告)号: CN115410025A 公开(公告)日: 2022-11-29
发明(设计)人: C·布莱奥塔 申请(专利权)人: 罗伯特·博世有限公司
主分类号: G06V10/764 分类号: G06V10/764;G06V10/774;G06V20/56
代理公司: 中国专利代理(香港)有限公司 72001 代理人: 刘艺诗;周学斌
地址: 德国斯*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 图像 分类 训练 数据 扩充
【权利要求书】:

1.一种用于从输入图像x生成输出图像xg的方法(100),给定图像分类器(3)将所述输出图像xg分类为从给定分类的多个可用类中选择的目标类c’,所述方法包括以下步骤:

• 借助于经训练的编码器网络(1)将输入图像x映射(110)到潜在空间中的较低维度表示z;

• 从给定分布中抽取(115)噪声样本n;和

• 借助于经训练的生成器网络(2)将噪声样本n映射(120)到输出图像xg,其中该映射以目标类c’和表示z两者为条件。

2.根据权利要求1所述的方法(100),其中使映射以表示z为条件包括:经训练的生成器网络(2)产生输出图像xg,经训练的编码器网络(1)将所述输出图像xg映射到表示z。

3.根据权利要求1至2中任一项所述的方法(100),其中,噪声样本n到输出图像xg的映射(120)进一步包括:

• 借助于给定的图像分类器(3),将输出图像xg映射(121)到分类分数c #;

• 借助于给定的分类损失函数(LC)确定(122)分类分数c#与输出图像xg到目标类c’的分类多么好地相符;以及

• 优化(123)到生成器网络(2)的至少一个输入,使得基于改变的输入对输出图像xg的重新计算有可能引起分类损失函数(LC)的值改进。

4.根据权利要求1至3中任一项所述的方法(100),其中输入图像x被选择(105)为具有源类,从而使输出图像xg成为输入图像x的反事实图像。

5.根据权利要求4所述的方法(100),进一步包括以下步骤:

• 比较(130)反事实图像xg和输入图像x;和

• 将其中反事实图像xg不同于输入图像x的区域()确定(140)为相对于源类c和目标类c’之间的类边界而言有意义的区域(S)。

6.根据权利要求5所述的方法(100),进一步包括以下步骤:

• 借助于给定度量(4)来确定(150)相对于类边界而言有意义的区域(S)与输入图像x的包含被认为显著的输入图像x的特征的给定区域(S*)多么好地相符;以及

• 将与由所述给定度量(4)输出的结果(4a)相称的分数(3a)归属(160)于图像分类器(3)。

7.根据权利要求6所述的方法(100),进一步包括:优化(170)表征给定图像分类器(3)的行为的参数(3b),使得当重复方法(100)的先前步骤(120-160)时,图像分类器(3)的分数(3a)有可能改进。

8.根据权利要求1至7中任一项所述的方法(100),其中,输入图像x是在产品的光学检查过程中已经获取的制造产品的图像,并且给定分类的类表示产品的质量等级。

9.根据权利要求1至7中任一项所述的方法(100),其中,输入图像x是交通情形的图像,并且给定分类的类表示与交通情形的解释相关的对象。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210585456.3/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top