[发明专利]一种基于图像样本的自动数据增强策略选择方法在审
申请号: | 202011526140.4 | 申请日: | 2020-12-22 |
公开(公告)号: | CN112651892A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 徐梦娟;姚鹏;申书伟;邵鹏飞 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T7/00;G06T7/90;G06T7/11;G06N3/04;G06N3/08 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 顾炜 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 样本 自动 数据 增强 策略 选择 方法 | ||
本发明提出一种基于图像样本的自动数据增强策略选择方法,包括如下步骤:步骤1、获取目标图像数据集;步骤2、建立数据增强策略搜索空间,其中包括多种数据增强策略;步骤3、设定参数N值,对每一个图像随机进行N次图像数据转换操作,每次操作都均等的从所设立的搜索空间中选择一种增强策略进行图像变换操作;步骤4、设定参数P值,即单次增强策略有P的概率值会进行增强操作,也有1‑P的概率保持图像不变,若进行图像变换,则变换幅度在设定变换量级范围内随机选择;步骤5、在经过N次图像变换后,以随机裁剪的方式对经过图像增强的数据进行剪裁,获取输入至神经网络模型的图像样本;步骤6、将裁剪后的图像数据输入到深度神经网络模型进一步训练。
技术领域
本发明涉及图像处理领域,特别是医学图像数据增强策略方法领域。
背景技术
1)随着图像处理技术特别是深度学习技术的快速发展,在很多方面需要用到大量的有标记数据,比如人脸识别、医学影像相关疾病的自动诊断等,而获取充足的标记数据是一份非常耗时耗力的工作。数据增强是一种有效的解决标注数据不足的一种方法,它能够利用现有的标注数据,通过一系列图像转换操作,生成新的数据,从而有效的扩充数据集。
2)近年来,在大量的图像处理,以及医学影像处理任务中,通常使用深度神经网络技术来提取图像的特征,可以取得更高的性能。但是,为了保证深度神经网络模型的性能,通常需要大量的有标注样本进行训练,然而大量样本的获取是非常不容易的,特别是对于某些医学病例的样本,往往多年的积累也才累计到几千甚至几百例样本。同时对样本的标注也是非常耗时耗力的,比如要对一幅医学图像中的病灶进行精确的边缘分割标注,一个人往往需要几分钟甚至是十几分钟的时间。当需要的标注图像数较大时(比如10000幅),则需要大量的时间,从而使得获取有标注数据变得代价异常昂贵。由于图像数据采集工作量巨大,且人工标注耗时耗力,故在许多医学图像处理任务时,常使用数据增强技术。数据增强技术是一种较好的降低采集成本的方法,可以有效的扩展训练样本数,提高深度神经网络模型的识别准确率,使其有更好的泛化能力和鲁棒性。
3)目前常见的图像数据增强方法主要分为两种,分别为手工设计增强策略和自动增强策略。手工设计的数据增强方法通常需要丰富的专家经验,且这种方式设计出的策略通常难以达到最优的性能,因此现有工作已经提出了一些自动化的数据增强技术来缓解这个问题,例如,通过生成对抗网络生成新数据;创建通用的数据增强策略搜索空间,并在不同的通用数据集上搜索得到最佳的数据增强策略集合,如AutoAugment、RandAugment等;
4)数据增强是克服训练数据样本有限这一挑战的关键方法之一,数据增强可以扩展数据的多样性,能够充分提取原始图像数据的特征。当前自动增强策略相对于手工设计的增强策略,通常有更好的效果,但是自动搜索过程一般非常耗时,并且需要大量的计算资源,在很大程度上降低了数据增强方法的使用效率。
发明内容
为了解决上述技术问题,本发明旨在提出一种基于图像样本的自动数据增强策略选择方法,提高了图像数据的可利用性,能够更充分提取数据特征,从而尽可能降低标注数据不足的缺陷,扩大图像数据的多样性。通过此图像增强策略与深度学习技术相结合,可提高模型的识别准确性,同时该数据增强方法可以进一步推广应用至大量的医学图像处理任务中,特别是提升深度学习神经网络模型的识别准确率。
本发明的技术方案如下:
一种基于图像样本的自动数据增强策略选择方法,包括如下步骤:
步骤1、获取目标图像数据集;
步骤2、建立数据增强策略搜索空间,所述搜索空间包括多种数据增强策略,同时设立每种增强策略的量级取值范围;
步骤3、设定参数N值,其中N值表示对每一个图像随机进行N次图像数据转换操作,每次操作都均等的从所设立的搜索空间中选择一种增强策略进行图像变换操作;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011526140.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高浓度有机废水处理方法及装置
- 下一篇:一种新型超声复合鼓泡反应器
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序