[发明专利]用于生成行人图像的方法和装置及存储介质在审
申请号: | 202011118547.3 | 申请日: | 2020-10-19 |
公开(公告)号: | CN112257548A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 张武强 | 申请(专利权)人: | 戴姆勒股份公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京永新同创知识产权代理有限公司 11376 | 代理人: | 杨胜军 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 生成 行人 图像 方法 装置 存储 介质 | ||
本发明涉及一种用于生成行人图像的方法,该方法包括:获取场景区域的图像数据集,并对图像数据的场景区域进行分类,其中,场景区域按照语义被分类为行人可行区域和其它区域;利用训练数据和场景区域分类信息训练图像区域分割模型;获取目标背景图像;利用经训练的图像区域分割模型对目标背景图像进行语义分割,从而得到目标背景图像的行人可行区域并将其输出;获取目标行人图像;在行人可行区域中确定目标行人图像的合成位置;将目标行人图像合成到目标背景图像中。本发明还涉及一种相应的装置和一种机器可读存储介质。
技术领域
本发明涉及计算机技术领域及自动驾驶领域。具体地,本发明涉及一种用于尤其在自动驾驶场景下生成行人图像的方法和装置。
背景技术
人工神经网络(英文:Artificial Neural Network,缩写:ANN)是一种模仿动物神经网络行为特征的、通过对大量数据的分布式并行信息处理来学习数据特征的算法数学模型。人工神经网络依靠系统的复杂程度、通过调整内部多个节点之间的相互关系实现处理信息的目的,并且具有自学习和自适应的能力。
在此,人工神经网络也可以用来学习生成目标图像。尽管现有生成式网络可以生成高质量的人物图像,但现有的生成式网络没有对背景进行语义识别分析,无法确保生成的图像的语义信息以及物理合理性,使得生成的图像不自然逼真。在自动驾驶场景下生成行人图像的情况下,现有的生成式模型无法确定在背景中合成的行人的合理位置和尺寸,因而合成的行人图像可能会出现在天空、树上等不合理的区域中,或者合成的行人尺寸不符合近大远小的成像原理,使得合成的图像不真实自然。针对上述缺点,存在对在自动驾驶场景下生成行人图像的改进方法的需求。
发明内容
在该背景下,本发明的任务是提出一种用于尤其在自动驾驶场景下生成行人图像的方法和相应的装置以及一种机器可读存储介质。通过本发明的方法和装置能够基于对背景图像的识别分析结果和生成模型来生成符合语义且自然逼真的行人图像。由此,所述方案能够至少部分克服现有技术方案中的不足。
根据本发明的第一方面,提供一种用于生成行人图像的方法,所述方法包括以下方法步骤:
获取场景区域的图像数据集,并对图像数据的场景区域进行分类,其中,所述场景区域按照语义被分类为行人可行区域和其它区域;
利用训练数据和场景区域分类信息训练图像区域分割模型;
获取目标背景图像;
利用经训练的图像区域分割模型对所述目标背景图像进行语义分割,从而得到所述目标背景图像的行人可行区域并将其输出;
获取目标行人图像;
在所述行人可行区域中确定所述目标行人图像的合成位置;以及
将所述目标行人图像合成到所述目标背景图像中。
本发明能够基于对背景图像的识别分析来自动地提供合理的行人位置和尺寸,使得可以更好地控制合成的图像使其具有符合的语义和物理合理性,从而合成的图像的质量相比现有技术更高并且图像更自然逼真。
在根据本发明的方法中,场景区域可以分为行人可行区域和其它区域。行人可行区域是指行人所处的、符合语义合理性的区域。所述行人可行区域例如包括人行横道、十字路口等区域。相反,例如天空,树等不符合行人可行区域的语义和物理合理性的这些区域则属于其它区域。
根据一个示例性实施方式,在所述行人可行区域中确定所述目标行人图像的合成位置的步骤中,提取所述目标行人图像的合成位置的深度信息,根据所述深度信息确定所述目标行人图像的合理尺寸并且根据所述目标行人图像的合成位置和尺寸将所述目标行人图像合成到所述目标背景图像中。由此,能够根据该深度信息提供符合成像原理的目标行人图像的合理尺寸,使得目标行人图像合成到所述目标背景图像中的效果更自然逼真。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于戴姆勒股份公司,未经戴姆勒股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011118547.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序