[发明专利]基于图像数据增强的图像训练集生成方法和模型训练方法在审
申请号: | 202110617897.2 | 申请日: | 2021-06-03 |
公开(公告)号: | CN113361588A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 陈映;曹松;任必为 | 申请(专利权)人: | 北京文安智能技术股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100094 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图像 数据 增强 训练 生成 方法 模型 | ||
本发明提供了一种基于图像数据增强的图像训练集生成方法和模型训练方法,其中,图像训练集生成方法包括:构造初始图像训练集后训练初始目标检测模型;对原始训练样本图像进行重检测后输出检测输出图像;比较各检测输出图像上形成的检测框和原始训练样本图像上的标注框,将检测框框选的错误目标图像块裁切下;在选中的原始训练样本图像上裁切下剔除图像块,选取错误目标图像块补偿在剔除图像块的原始位置处形成负样本图像;混合进入初始图像训练集中形成图像训练集。本发明解决了利用现有技术中的数据增强方法扩充的图样训练集,能够提升训练出的目标检测模型的泛化能力,但无法提高目标检测模型对特定的目标对象的识别准确率的问题。
技术领域
本发明涉及图像处理以及模型训练技术领域,具体而言,涉及一种基于图像数据增强的 图像训练集生成方法和模型训练方法。
背景技术
现有的计算机视觉领域中,通常使用基于深度学习的目标检测模型来进行决策,为了达 到对目标检测模型理想的训练效果,在模型训练过程中需要使用到包含有大量图像样本的图 像训练集,而在图像样本在数量不足的情况下,便需要采用数据增强的手段来扩充图像训练 集。
相关技术中,通常采用几何变换、颜色变化或混合样本数据增强生成难例的方式来获得 更多的图像样本数据,上述的几种数据增强方法虽然能够有效地扩充图样训练集,丰富图样 训练集中的图像样本数据多样性,提升训练出的目标检测模型的泛化能力;但对于提升目标 检测模型针对特定的目标对象的识别准确率则没有明显帮助,从而导致现有的目标检测模型 存在一定的使用局限性。例如,在道路交通场景中,对道路上行驶车辆的车牌或驾乘人员的 准确监控识别,直接影响到道路交通的综治管理的稳定性、道路交通运输的安全性,因此, 如何稳定地训练出对目标对象具备高精度识别的目标检测模型,便成了现有技术中亟待解决 的问题。
发明内容
本发明的主要目的在于提供一种基于图像数据增强的图像训练集生成方法和模型训练方 法,以解决利用现有技术中的数据增强方法扩充的图样训练集,能够提升训练出的目标检测 模型的泛化能力,但无法提高目标检测模型对特定的目标对象的识别准确率的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种基于图像数据增强的图像训练 集生成方法,包括:步骤S1,采集多张目标场景图像后使用标注框框选出其中的目标对象, 以形成多张原始训练样本图像,汇集多张原始训练样本图像构成初始图像训练集,并基于深 度神经网络利用初始图像训练集训练形成初始目标检测模型;步骤S2,使用初始目标检测模 型对初始图像训练集中的多张原始训练样本图像进行重检测,以形成一一对应的多张检测输 出图像;比较各检测输出图像上形成的检测框和与其相对应的原始训练样本图像上的标注框 的属性信息,以识别出检测输出图像上错误检测为目标对象的部分检测框,并将该部分检测 框框选的错误目标图像块裁切下汇集形成负样本图像增强数据集;步骤S3,选取初始图像训 练集中的至少一部分原始训练样本图像,在选中的每张原始训练样本图像上裁切下至少一个 剔除图像块,针对裁切下的每个剔除图像块,使用负样本图像增强数据集中随机选取的一个 错误目标图像块补偿在剔除图像块的原始位置处,以形成负样本图像;步骤S4,将生成的所 有负样本图像混合进入初始图像训练集中形成图像训练集,图像训练集用于对初始目标检测 模型优化训练。
进一步地,在步骤S3中,选取初始图像训练集中的一部分原始训练样本图像,在选中的 每张原始训练样本图像上裁切下多个剔除图像块,使用多个错误目标图像块一一对应地补偿 在多个剔除图像块的原始位置处,以形成负样本图像;在步骤S4中,将生成的所有负样本图 像与初始图像训练集中的另一部分原始训练样本图像混合后形成图像训练集。
进一步地,在各原始训练样本图像上裁切下相间隔的多个剔除图像块,且相间隔的多个 剔除图像块均与原始训练样本图像上框选目标对象的标注框相间隔。
进一步地,在各原始训练样本图像上裁切下相邻的多个剔除图像块,且相邻的多个剔除 图像块均与原始训练样本图像上框选目标对象的标注框相间隔或相邻;相邻的两个剔除图像 块或剔除图像块与标注框之间的重叠面积为零。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京文安智能技术股份有限公司,未经北京文安智能技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110617897.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置