[发明专利]一种生成深度学习样本的方法有效
申请号: | 201810753123.0 | 申请日: | 2018-07-10 |
公开(公告)号: | CN108932735B | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 李元龙 | 申请(专利权)人: | 广州众聚智能科技有限公司 |
主分类号: | G06T7/70 | 分类号: | G06T7/70;G06T7/136 |
代理公司: | 成都顶峰专利事务所(普通合伙) 51224 | 代理人: | 何红信 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 生成 深度 学习 样本 方法 | ||
本发明属于图像处理技术领域,公开了一种生成深度学习样本的方法。本发明包括以下步骤:采集纯色背景下拍摄的初始图像;从初始图像中获取到目标图像的位置及轮廓,并截取出目标图像;对截取出的目标图像进行数据增广,得到目标图像的初始数据集;从初始数据集中选取任一目标图像后,将当前目标图像随机放置于预设的背景图形中并进行泊松图形融合,然后记录当前目标图像在预设背景图像中的位置;重复步骤S4,形成深度学习的目标检测数据集。本发明减少了海量目标数据的准备时间成本、人力成本及硬件成本,生成优质的目标检测数据集,进而为深度学习提供了优质的样本,增加了目标检测网络的鲁棒性。
技术领域
本发明属于图像处理技术领域,具体涉及一种生成深度学习样本的方法。
背景技术
在图像识别的多目标检测任务中,例如商品识别、招牌识别等,常使用深度学习的方法,其要求海量的训练样本数据,并且需要对图像中的目标做标注,但是往往采集数据和标注数据需要很高的成本。
同时,一般在训练样本集较小的情况下,会使用数据增广技术,即对训练图像进行旋转、裁剪、翻转等操作来扩大样本数据集,然而这种处理过于简单,没有增加背景的复杂程度,因此应用在目标检测任务中,效果不佳。
发明内容
为了解决现有技术存在的上述问题,本发明目的在于提供一种节省成本、增加了目标检测网络的鲁棒性、适用于各种场景的生成深度学习样本的方法。
本发明所采用的技术方案为:
一种生成深度学习样本的方法,包括以下步骤:
S1.采集纯色背景下拍摄的初始图像;
S2.从初始图像中获取到目标图像的位置及轮廓,并截取出目标图像;
S3.对截取出的目标图像进行数据增广,得到目标图像的初始数据集;
S4.从初始数据集中选取任一目标图像后,将当前目标图像随机放置于预设的背景图形中并进行泊松图形融合,然后记录当前目标图像在预设背景图像中的位置;
S5.重复步骤S4,形成深度学习的目标检测数据集。
作为优选,所述的步骤S2中,首先计算初始图像的形态学梯度,接着进行阈值分割,然后获取到目标图像的位置及轮廓。
作为优选,计算初始图像的形态学梯度时,根据公式:
dst(x,y)=max{src(x-r:x+r,y-r:y+r)}-min{src(x-r:x+r,y-r:y+r)};
其中,src为初始图像,src(x-r:x+r,y-r:y+r)为方形邻域,方形邻域的四个角坐标分别为(x+r,y+r)、(x-r,y-r)、(x+r,y-r)及(x-r,y+r),dst(x,y)即为该方形邻域内的最大值与最小值的差。
作为优选,所述的步骤S3中,进行数据增广时,对截取出的目标图像进行几何变换操作和/或像素变换操作;所述的初始数据集中的目标图像的数量为截取出的目标图像的数量的千倍以上。
作为优选,所述的几何变换操作包括旋转操作、翻转操作、裁剪操作及仿射操作;所述的像素变换操作包括加噪操作、透视操作、亮度操作及对比度操作。
作为优选,所述的步骤S4中,进行泊松融合时,步骤如下:
S41.分别计算背景图像的梯度与当前目标图像,其中,梯度包括x方向的x梯度及y方向的y梯度;
S42.在背景图像中随机选取放置当前目标图像的位置,将当前位置的背景图像的梯度替换成目标图像的梯度,得到初始融合图像的初始梯度mix_grad_x和mix_grad_y,然后将目标图像复制至当前位置,得到初始融合图像mix;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州众聚智能科技有限公司,未经广州众聚智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810753123.0/2.html,转载请声明来源钻瓜专利网。