[发明专利]用于生成具有对象预定计数的图像的生成器网络在审

申请号：	202111149969.1	申请日：	2021-09-29
公开（公告）号：	CN114332552A	公开（公告）日：	2022-04-12
发明（设计）人：	A·萨森德兰;K·斯库布奇;M·基普尔	申请（专利权）人：	罗伯特·博世有限公司
主分类号：	G06V10/774	分类号：	G06V10/774;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08
代理公司：	中国专利代理(香港)有限公司 72001	代理人：	任一方;吕传奇
地址：	德国斯***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于生成具有对象预定计数图像生成器网络
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于训练生成器网络（1）的方法（100），生成器网络（1）被配置为生成具有多个对象（14a-14d）的图像（13），所述方法包括：

● 提供（110）训练图像（11）集合，并且对于每个训练图像（11），提供相应训练图像（11）包含的对象（14a-14d）的至少一个实际计数（15a-15d）；

● 提供（115）生成器网络（1），生成器网络（1）被配置为将噪声样本（17）和对象（14a-14d）的至少一个目标计数（16a-16d）的组合映射到生成图像（13）；

● 提供（120）鉴别器网络（2），鉴别器网络（2）被配置为将图像（21）映射到以下各项的组合：图像是训练图像（11）还是由生成器网络（1）生成的生成图像（13）的判定（23），以及图像（21）中对象（14a-14d）的至少一个预测计数（18a-18d）；

● 抽取（130）噪声样本（17）和对象（14a-14d）的目标计数（16a-16d）；

● 由生成器网络（1）将噪声样本（17）和对象（14a-14d）的目标计数（16a-16d）映射（140）到生成图像（13）；

● 从包括生成图像（13）以及训练图像（11）的池（P）随机抽取（150）图像（21）；

● 将随机抽取的图像（21）供应（160）到鉴别器网络（2），从而将它们映射到以下各项的组合：相应的图像（21）是训练图像（11）还是生成图像（13）的判定（23），以及该图像（21）中对象（14a-14d）的至少一个预测计数（18a-18d）；

● 用如下目标优化（170）表征鉴别器网络（2）行为的鉴别器参数（22）：改进鉴别器网络（2）在生成图像（13）和训练图像（11）之间进行区分所具有的准确度；

● 用退化所述准确度的目标优化（180）表征生成器网络（1）行为的生成器参数（12）；和

● 用如下目标进一步优化（190）生成器参数（12）和鉴别器参数（22）二者：改进在一方面对象（14a-14d）的预测计数（18a-18d）与另一方面对象（14a-14d）的实际（15a-15d）或目标（16a-16d）计数之间的匹配。

2.根据权利要求1所述的方法（100），其中，提供（121）鉴别器网络（2），鉴别器网络（2）包括：

● 包括多个卷积层和分类层的第一网络（2a），被配置为将这些卷积层的结果映射到被输入到鉴别器网络（2）的图像是训练图像（11）还是生成图像（13）的判定（23）；和

● 包括多个卷积层和回归层的第二网络（2b），被配置为将这些卷积层的结果映射到图像（21）中对象（14a-14d）的至少一个预测计数（18a-18d）。

3.根据权利要求2所述的方法（100），其中，在鉴别器网络（2）的训练期间，

● 表征第一网络（2a）中至少一个卷积层的行为的更新参数也在第二网络（2b）中的对应卷积层中被更新（121a），和/或

● 表征第二网络（2b）中至少一个卷积层的行为的更新参数也在第一网络（2a）中的对应卷积层中被更新（121b）。

4.根据权利要求1至3中任一项所述的方法（100），其中，用优化公共损失函数值的目标来执行（195）生成器参数（12）和鉴别器参数（22）的优化（170-190），所述公共损失函数值包括：

● 鉴别器网络（2）识别训练图像（11）变得越低越好的第一贡献；

● 鉴别器网络（2）识别生成图像（13）变得越低越好的第二贡献；和

● 如果输入到鉴别器网络（2）的图像（21）是训练图像（13），则对象（14a-14d）的预测计数（18a-18d）与对象（14a-14d）的实际计数（15a-15d）匹配变得越低越好，或者如果输入到鉴别器网络（2）的图像（21）是生成图像（13），则对象（14a-14d）的预测计数（18a-18d）与对象（14a-14d）的目标计数（16a-16d）匹配变得越低越好的第三贡献。

5.根据权利要求4所述的方法（100），其中，第三贡献是一方面对象（14a-14d）的实际（15a-15d）或目标（16a-16d）计数与另一方面对象（14a-14d）的预测计数（18a-18d）之间差的范数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司，未经罗伯特·博世有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111149969.1/1.html，转载请声明来源钻瓜专利网。

上一篇：在测量系统的不同配置之间变换测量数据
下一篇：用于带电粒子系统中样品的3D图像的深度重建

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于生成具有对象预定计数的图像的生成器网络在审

专利文献下载