[发明专利]基于泊松图像融合及图像风格化的交互式数据扩展方法有效
申请号: | 201911381227.4 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111199531B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 黄睿;邢艳;刘挺;段博坤 | 申请(专利权)人: | 中国民航大学 |
主分类号: | G06T5/50 | 分类号: | G06T5/50;G06T5/00 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
地址: | 300300 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图像 融合 风格 交互式 数据 扩展 方法 | ||
本发明公开了一种基于泊松图像融合及图像风格化的交互式数据扩展方法,包括:基于泊松图像编辑的交互式数据增强方式,通过读取原始图像的标注信息对发动机缺陷进行提取,并构建缺陷信息库;基于Pytorch框架对风格迁移模型中的训练参数进行调整,用于将缺陷信息的风格转换成背景图中相应位置的风格,获取新缺陷图像;将新缺陷图像与背景图像融合,并利用泊松融合对融合边界进行修正,减小融合痕迹,获取带有新缺陷的发动机孔探图像,并将其作为扩展图像用于发动机孔探图像缺陷检测任务的模型训练;对若干张原始图像进行交互式数据扩展,生成若干张新缺陷图像,将原始图像和新缺陷图像作为一个图像二分类数据集,对新缺陷图像进行判定。
技术领域
本发明涉及数据增强领域,尤其涉及一种基于泊松图像融合及图像风格化的交互式数据扩展方法。
背景技术
现有的数据扩展方法一般分为两大类:传统的数据扩展方法和基于深度学习的数据扩展方法。传统的数据扩展方法包括:一、对图像进行左右翻转、随机旋转、裁剪、缩放、平移等;二、局部的变形调整,对图像添加噪声扰动如高斯白噪声、椒盐噪声;三、改变图像的颜色;四、改变图像的亮度、对比度、清晰度;五、对图像进行仿射变化等。其中常用的方法是裁剪缩放,翻转和颜色亮度变化,文献[1]总结了在网络中使用的典型数据扩展方法。在文献[2]中作者提到裁剪一定程度可以使网络对待检测目标的尺度信息更加不敏感,由此可以提升网络对小物体的识别效果。文献[3]通过仿射变换的方法生成的新样本,降低了分类的错误率。
使用传统的数据扩展方法可以在一定程度上解决训练样本不足的问题,提高模型的泛化能力。但由于扩充后的数据仅是对现有数据的线性或者非线性变化,没有真正增加数据的样本空间,大量使用容易导致深度学习模型在扩展的数据上过拟合,降低了深度学习模型的泛化能力。并且大量使用传统数据扩展,无法更进一步提升模型的效果。常用的基于深度学习的数据扩展方法则主要集中在GAN(对抗生成网络)的应用上。文献[4]使用条件型生成对抗网络(Conditional GANs)将一张图像从一个领域转换到另一个领域,可以实现风景图像中季节的变换以达到数据扩展的目的。国内的陈文兵等人集成了高斯混合模型和CGAN提出了GMM-CGAN[5]的数据扩展方法,该方法使得CNN模型在使用CGAN数据扩展完成训练的条件下,仍然提升了14.1%的分类准确率。使用GANs网络进行数据增强的方法是稳健的,但它的计算量巨大且GANs的模型相对来说难以训练,对于较大型的数据扩展任务来说并不适用。一种可行替代方法是使用风格迁移模型来对图像进行纹理,氛围,外观上的改变。常见的风格迁移模型[6]如将现实人物风格化为油画人物,将现实风景风格化为艺术作品的风格。这种方法的缺点是其输出更具有艺术性而非现实性。Falong[7]等人提出的利用元网络与转换网络实现任意风格任意内容的极速转换,可以根据用户自己的源数据集与目标数据集训练非艺术风格的风格迁移模型,其转换网络规模小往往只有不到100k,可以部署到很多平台。
除了这两大类常用的数据扩展方法之外,针对数据不平衡的问题,文献[8]通过人工合成新样本来处理样本不平衡问题,从而提升分类器性能。MIT和Facebook的人工智能研究院提出的Mixup[9]也采用了同样的思路来通过样本插值的方法合成新样本。
上述数据扩展方法确实对模型的训练提供了很大的帮助,但他们都是在全局上对原始图像进行扩充,甚至在使用GANs生成全新的数据时其输出也是不可控的(比如你想要一张发动机的缺陷照片,但它可能生成一张没有缺陷或者缺陷位置不合实际的新照片),而且对于需要标签信息的有监督网络训练GANs产生数据的同时并不能同时生成标签信息,再加上GANs模型的难以训练,进一步限制了该方法的使用。
参考文献
[1]Howard A G.Some Improvements on Deep Convolutional Neural NetworkBased Image Classification[J].Computer Science,2013.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航大学,未经中国民航大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911381227.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序