[发明专利]生成训练图像的方法以及目标识别系统的学习方法在审

申请号：	201510884893.5	申请日：	2015-12-03
公开（公告）号：	CN105678315A	公开（公告）日：	2016-06-15
发明（设计）人：	安瑟伦·斯蒂芬·哈塞尔霍夫;丹尼斯·穆勒;米尔科·尼古拉斯·莫伊特;克里斯蒂安·马库斯·纳恩	申请（专利权）人：	戴尔菲技术公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06K9/00
代理公司：	深圳鼎合诚知识产权代理有限公司 44281	代理人：	彭愿洁;彭家恩
地址：	美国密***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	生成训练图像方法以及目标识别系统学习方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种生成训练图像的方法，特别是为基于摄像机的目标识别系统的学习提供的训练图像，该图像显示了自然目标环境中待识别目标。

背景技术

基于摄像机的目标识别系统在汽车工程中尤其变得越来越重要。计算机辅助图像处理系统能够可靠地识别不同的感兴趣目标，例如所拍到的摄像图像中的路标、车道标记、行人等等。所谓的学习方法或训练方法经常用于开发和/或改编相应的识别算法。在该方法中，将一系列训练图像提交给图像处理系统，这些训练图像是样本图像，示出了相应的目标环境中的典型待识别目标。

在基于图像的目标识别技术领域中，已经公开了许多不同的学习方法。然而，这些方法都需要相当多的不同的训练图像，以达到可接受的学习结果。在许多实际情况下，采用所谓的分类器进行学习，通过分类器，可以将图像中识别出的目标划分到不同且不相关联的对象类中。在具有相对多数量的类的应用中，尤其存在这样一个问题，即需要花费大量的时间和精力来获取训练图像。当特定类的对象在日常现实中相对少时，这一问题可能会更严重。例如，德国有14种不同版本的限速路标——从5km/h高达130km/h。可以想象得到，在这种情况下，为所有14类生成足够规模的数据集，是极其复杂的，特别是对于那些比较少出现的路标的类，例如限速5km/h或110km/h。

因此，需要一种生成训练图像的简化方法。

发明内容

这个目的是通过具有权利要求1的特征的方法来满足。

根据本发明，通过将摄像机拍摄的基础图像和模板图像进行组合，来生成作为合成图像的训练图像，在一个主要的示例中，通过移位映射算法从基础图像获得结构特征，将该结构特征替代为从模板图像获得的结构特征。

以此方式，同一个基础图像可以设置有不同目标。例如，基础图像中的50km/h限速路标可以替换为5km/h的限速路标，该基础图像是用摄像机以常规方式拍摄而得，其在本文中也被称为自然图像。使用这种合成的训练图像，可以极大地减少为数据提供而耗费的精力。移位映射算法的使用使所生成的合成图像具有与基础图像同样的自然外观。然而，在与各个目标相应的直接替换的图像区域不可避免会出现有关照明条件的可识别差异，使用移位映射算法，自然基础图像的照明程度和整体表现将始终保持为结构特征的替换。

本发明的另一改进可以从从属权利要求、说明书和附图看出。

优选地，结构特征的替换可以仅通过重新排列基础图像的像素来实现。为此目的，可以于移位映射算法的框架内执行一种重新排列的方法。合成的训练图像中只出现那些色调值，而那些色调值也出现于自然基础图像中，这是十分有利的。因此，即使训练图像是合成图像，但是它具有完全的自然感观，即使它是合成图像。

在本发明的一种实施方式中，基础图像的像素的重新排列被限制于基础图像的一部分区域，优选为中央部分区域。这可以通过适当调整移位映射算法的优化准则以简单方式而产生。从而，像素的重新排列可以限制于其中通常会有待识别对象的图像的部分区域。这种调整方法的优点之一在于，完全没有改变目标周围的背景。

根据本发明的另一实施方式，优化准则被用于移位映射算法，其包括保持基础图像的像素间距离关系、避免所生成的训练图像出现色调值不连续、和/或保持基础图像和模板图像间的相似度。以此方式，可以生成有特别自然外观的训练图像。

根据本发明一特定实施方式，将基础图像和模板图像相互比较，以确定出用于表示图像相似度的距离维度，该距离维度用作为移位映射算法的优化准则。距离维度为各个图像的相似度提供客观标准，其可以成为移位映射算法的优化函数的一部分，例如能量函数或位势。

优选地，在相互比较基础图像和模板图像以确定距离尺寸之前，将基础图像和模板图像转换成标准参考帧。在标准的参考帧中，这两幅图像有充分的对象相关可比性。特别地，通过标准转换可以将对象的倾斜、变形或位移考虑进去。

结构特征可以是纹理和/或图案。如果待识别目标是路标，图案可以是，例如，表示限速值的数字序列。

模板图像可以是摄像机拍摄的图像，换言之，模板图像是自然图像。对于相对罕见的目标，只需要拍摄若干幅图像或甚至仅一幅图像，就足够生成用于这种目标类型的多幅不同的训练图像。因此，在本实施方式中，将两幅自然图像彼此结合来生成训练图像。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于戴尔菲技术公司，未经戴尔菲技术公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201510884893.5/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]生成训练图像的方法以及目标识别系统的学习方法在审

专利文献下载