[发明专利]生成训练图像的方法以及目标识别系统的学习方法在审
申请号: | 201510884893.5 | 申请日: | 2015-12-03 |
公开(公告)号: | CN105678315A | 公开(公告)日: | 2016-06-15 |
发明(设计)人: | 安瑟伦·斯蒂芬·哈塞尔霍夫;丹尼斯·穆勒;米尔科·尼古拉斯·莫伊特;克里斯蒂安·马库斯·纳恩 | 申请(专利权)人: | 戴尔菲技术公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 彭愿洁;彭家恩 |
地址: | 美国密*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 训练 图像 方法 以及 目标 识别 系统 学习方法 | ||
技术领域
本发明涉及一种生成训练图像的方法,特别是为基于摄像机的目标识别系统的学 习提供的训练图像,该图像显示了自然目标环境中待识别目标。
背景技术
基于摄像机的目标识别系统在汽车工程中尤其变得越来越重要。计算机辅助图像 处理系统能够可靠地识别不同的感兴趣目标,例如所拍到的摄像图像中的路标、车道标记、 行人等等。所谓的学习方法或训练方法经常用于开发和/或改编相应的识别算法。在该方法 中,将一系列训练图像提交给图像处理系统,这些训练图像是样本图像,示出了相应的目标 环境中的典型待识别目标。
在基于图像的目标识别技术领域中,已经公开了许多不同的学习方法。然而,这些 方法都需要相当多的不同的训练图像,以达到可接受的学习结果。在许多实际情况下,采用 所谓的分类器进行学习,通过分类器,可以将图像中识别出的目标划分到不同且不相关联 的对象类中。在具有相对多数量的类的应用中,尤其存在这样一个问题,即需要花费大量的 时间和精力来获取训练图像。当特定类的对象在日常现实中相对少时,这一问题可能会更 严重。例如,德国有14种不同版本的限速路标——从5km/h高达130km/h。可以想象得到,在 这种情况下,为所有14类生成足够规模的数据集,是极其复杂的,特别是对于那些比较少出 现的路标的类,例如限速5km/h或110km/h。
因此,需要一种生成训练图像的简化方法。
发明内容
这个目的是通过具有权利要求1的特征的方法来满足。
根据本发明,通过将摄像机拍摄的基础图像和模板图像进行组合,来生成作为合 成图像的训练图像,在一个主要的示例中,通过移位映射算法从基础图像获得结构特征,将 该结构特征替代为从模板图像获得的结构特征。
以此方式,同一个基础图像可以设置有不同目标。例如,基础图像中的50km/h限速 路标可以替换为5km/h的限速路标,该基础图像是用摄像机以常规方式拍摄而得,其在本文 中也被称为自然图像。使用这种合成的训练图像,可以极大地减少为数据提供而耗费的精 力。移位映射算法的使用使所生成的合成图像具有与基础图像同样的自然外观。然而,在与 各个目标相应的直接替换的图像区域不可避免会出现有关照明条件的可识别差异,使用移 位映射算法,自然基础图像的照明程度和整体表现将始终保持为结构特征的替换。
本发明的另一改进可以从从属权利要求、说明书和附图看出。
优选地,结构特征的替换可以仅通过重新排列基础图像的像素来实现。为此目的, 可以于移位映射算法的框架内执行一种重新排列的方法。合成的训练图像中只出现那些色 调值,而那些色调值也出现于自然基础图像中,这是十分有利的。因此,即使训练图像是合 成图像,但是它具有完全的自然感观,即使它是合成图像。
在本发明的一种实施方式中,基础图像的像素的重新排列被限制于基础图像的一 部分区域,优选为中央部分区域。这可以通过适当调整移位映射算法的优化准则以简单方 式而产生。从而,像素的重新排列可以限制于其中通常会有待识别对象的图像的部分区域。 这种调整方法的优点之一在于,完全没有改变目标周围的背景。
根据本发明的另一实施方式,优化准则被用于移位映射算法,其包括保持基础图 像的像素间距离关系、避免所生成的训练图像出现色调值不连续、和/或保持基础图像和模 板图像间的相似度。以此方式,可以生成有特别自然外观的训练图像。
根据本发明一特定实施方式,将基础图像和模板图像相互比较,以确定出用于表 示图像相似度的距离维度,该距离维度用作为移位映射算法的优化准则。距离维度为各个 图像的相似度提供客观标准,其可以成为移位映射算法的优化函数的一部分,例如能量函 数或位势。
优选地,在相互比较基础图像和模板图像以确定距离尺寸之前,将基础图像和模 板图像转换成标准参考帧。在标准的参考帧中,这两幅图像有充分的对象相关可比性。特别 地,通过标准转换可以将对象的倾斜、变形或位移考虑进去。
结构特征可以是纹理和/或图案。如果待识别目标是路标,图案可以是,例如,表示 限速值的数字序列。
模板图像可以是摄像机拍摄的图像,换言之,模板图像是自然图像。对于相对罕见 的目标,只需要拍摄若干幅图像或甚至仅一幅图像,就足够生成用于这种目标类型的多幅 不同的训练图像。因此,在本实施方式中,将两幅自然图像彼此结合来生成训练图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于戴尔菲技术公司,未经戴尔菲技术公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510884893.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:牌号识别方法
- 下一篇:一种图像分离方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序