[发明专利]一种图片合成的方法及装置有效
申请号: | 202010172689.1 | 申请日: | 2020-03-12 |
公开(公告)号: | CN111508045B | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 陈海波 | 申请(专利权)人: | 深兰人工智能芯片研究院(江苏)有限公司 |
主分类号: | G06T11/60 | 分类号: | G06T11/60;G06T7/194;G06T3/40;G06T3/60 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 柴燕梅 |
地址: | 213161 江苏省常州市武进*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图片 合成 方法 装置 | ||
本发明提供一种图片合成的方法及装置,针对第一图片集合中的任一第一图片,从第一图片的背景图中截取背景子图;以第一随机方式确定各背景子图在图片中的位置,从而将各背景子图布局为背景图片;针对第二图片集合中的任一第二图片,从所述第二图片中获取前景对象;以第二随机方式确定各前景对象在所述背景图片中的位置,从而将各前景对象布局在所述背景图片中得到合成图片。该方案通过将截取自第一图片集合中的多个第一图片的背景子图布局为背景图片,实现了将不同图片的背景置于同一图片上,极大地增强了所得到的图片的背景随机性;进一步实现了将不同图片的前景置于同一图片上,且这些前景符合人眼识别规律。
技术领域
本发明涉及目标检测技术领域,尤其涉及一种图片合成的方法及装置。
背景技术
近些年来,目标检测已然成为计算机视觉领域中最火热的方向之一,其任务为检测给定图片中训练过的目标类别和对应的位置框。由于目标检测的高度复杂性,通常要求神经网络模型对目标具有尺度和位置不变性,因此要求数据量极为庞大的训练集。数据增强是一种提升现有数据集数据量的常用手段,能够帮助提升模型的泛化能力,防止过拟合。
传统的数据增强方法有:
1、图像反转:包括水平和垂直翻转;
2、图像平移:图像向水平或者垂直方向偏移;
3、图像缩放/裁剪:缩放图像或裁去部分图像;
4、图像旋转/仿射:旋转图像或对图像做仿射变换;
5、添加噪声:对图像添加噪声,如随机噪声、高斯噪声等;
6、色彩抖动:变换图像的亮度、饱和度、对比度等;
7、其它方式。
以上的数据增强方法都是作用在整张单一的图像上的,并没有破坏目标的上下文信息,也即图片背景的随机性不足。
综上,现有技术在数据增强过程中,存在无法提高图片背景随机性的问题。
发明内容
本发明提供一种图片合成的方法及装置,用以解决图片背景随机性不强的问题。
第一方面,本发明实施例提供一种图片合成的方法,该方法包括:针对第一图片集合中的任一第一图片,从所述第一图片的背景图中截取背景子图;以第一随机方式确定各背景子图在图片中的位置,从而将各背景子图布局为背景图片;针对第二图片集合中的任一第二图片,从所述第二图片中获取前景对象;以第二随机方式确定各前景对象在所述背景图片中的位置,从而将各前景对象布局在所述背景图片中得到合成图片;所述合成图片中各前景对象之间的重叠区域小于第一设定阈值。
基于该方案,通过将截取自第一图片集合中的多个第一图片的背景子图布局为背景图片,实现了将不同图片的背景置于同一图片上,极大地增强了所得到的图片的背景随机性;此外,通过随机的方式、将取自第二图片集合中的多个第二图片的前景对象布局在所述背景图片上,实现了将不同图片的前景置于同一图片上,有利于程序同时对同一张图片上的多个前景对象进行学习;进一步地,由于各个前景对象之间的重叠概率低,使得所述背景图片上布局的各个前景对象符合人眼识别规律。
作为一种可能实现的方法,以第一随机方式确定各背景子图在图片中的位置,从而将各背景子图布局为背景图片,包括:随机确定各背景子图的图中心在所述图片中的位置;随机对各背景子图进行图片转换操作;将转换操作后的各背景子图按照各背景子图的图中心在所述图片中的位置,布局出所述背景图片。
基于该方案,通过对各背景子图执行各种类型的转换操作,并将转换操作后的各背景子图布局在同一张图片中预先设定好的位置,极大地增加了各背景子图在所述图片中的随机性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深兰人工智能芯片研究院(江苏)有限公司,未经深兰人工智能芯片研究院(江苏)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010172689.1/2.html,转载请声明来源钻瓜专利网。