[发明专利]一种数据增广对深度学习模型性能影响评估方法及系统在审
申请号: | 202111576340.5 | 申请日: | 2021-12-21 |
公开(公告)号: | CN114444653A | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 何云;何豪杰 | 申请(专利权)人: | 武汉中海庭数据技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06T3/00;G06K9/62;G06V10/774;G06V10/82 |
代理公司: | 武汉蓝宝石专利代理事务所(特殊普通合伙) 42242 | 代理人: | 范三霞 |
地址: | 430000 湖北省武汉市东湖新技术开发区软件园东路*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 增广 深度 学习 模型 性能 影响 评估 方法 系统 | ||
本发明涉及一种数据增广对深度学习模型性能影响评估方法及系统,其特方法包括:获取深度学习模型的原始数据集;基于生成式对抗网络通过不同的增广方式,对所述原始数据集进行增广,得到多个增广数据集;分别利用每个增广数据集训练所述深度学习模型,对每个训练后的深度学习模型进行测试和评估。本发明通过初始数据集对深度学习网络进行训练和测试得到基准的测评指标,便于后续的基于对抗网络数据增广的模型训练测试指标做比对分析。
技术领域
本发明属于深度学习与视觉识别技术领域,具体涉及一种数据增广对深度学习模型性能影响评估方法及系统。
背景技术
数据增广是深度学习中常用的技巧之一,主要用于增加训练数据集,让数据集尽可能的多样化,使得训练的模型具有更强的泛化能力。目前数据增广主要包括:水平/垂直翻转、旋转、缩放、裁剪、剪切,平移、对比度、色彩抖动和噪声等,这些变化的前提是不改变图像的标签,并且只能局限在图像领域,这些传统的数据增广算法对于深度学习模型性能影响较小,并没有从根本上解决数据不足的难题。
最近兴起的一些生成式对抗网络模型,由于其出色的性能引起了人们的广泛关注,这种基于网络合成的方法相比于传统的数据增强技术,虽然过程更加复杂,但是生成的样本更加多样性。
发明内容
为解决增广数据对模型的影响,验证和确定最佳的数据增广方式的问题,在本发明的第一方面提供了一种数据增广对深度学习模型性能影响评估方法,包括:获取深度学习模型的原始数据集;基于生成式对抗网络通过不同的增广方式,对所述原始数据集进行增广,得到多个增广数据集;分别利用每个增广数据集训练所述深度学习模型,对每个训练后的深度学习模型进行测试和评估。
在本发明的一些实施例中,所述基于生成式对抗网络通过不同的增广方式,对所述原始数据集进行增广,得到多个增广数据集包括:基于生成式对抗网络,对原始数据集中的一张或多张图像进行风格迁移,得到第一增广数据集;基于生成式对抗网络,对原始数据集中的一张或多张图像进行目标替换,得到第二增广数据集;基于生成式对抗网络,对原始数据集中的一张或多张图像进行风格迁移或目标替换,得到第三增广数据集。
进一步的,所述基于生成式对抗网络,对原始数据集中的一张或多张图像进行风格迁移,得到第一增广数据集包括:将原始数据集中的一张或多张图像作为目标图像;利用生成式对抗网络将非原始数据集中的图像的风格迁移到目标图像中,得到一张或多张增广图像。
进一步的,所述基于生成式对抗网络,对原始数据集中的一张或多张图像进行目标替换,得到第二增广数据集包括:将原始数据集中的一张或多张图像作为目标图像;利用生成式对抗网络将非原始数据集中的图像中一个或多个目标替换掉目标图像中的对应目标,得到一张或多张增广图像。
进一步的,所述基于生成式对抗网络,对原始数据集中的一张或多张图像进行风格迁移或目标替换,得到第三增广数据集包括:将第一增广数据集和第二增广数据集中的图像进行融合,得到第三增广数据集。
在上述的实施例中,所述生成式对抗网络为MSGAN。
本发明的第二方面,提供了一种数据增广对深度学习模型性能影响评估系统,包括:获取模块,用于获取深度学习模型的原始数据集;增广模块,用于基于生成式对抗网络通过不同的增广方式,对所述原始数据集进行增广,得到多个增广数据集;评估模块,用于分别利用每个增广数据集训练所述深度学习模型,对每个训练后的深度学习模型进行测试和评估。
进一步的,所述增广模块包括:第一增广单元,用于基于生成式对抗网络,对原始数据集中的一张或多张图像进行风格迁移,得到第一增广数据集;第二增广单元,用于基于生成式对抗网络,对原始数据集中的一张或多张图像进行目标替换,得到第二增广数据集;第三增广单元,用于基于生成式对抗网络,对原始数据集中的一张或多张图像进行风格迁移或目标替换,得到第三增广数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉中海庭数据技术有限公司,未经武汉中海庭数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111576340.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:钢结构组合楼板及其施工方法
- 下一篇:一种多型号弹上舵机测试设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置