[发明专利]一种图像数据的增广策略选取方法及系统在审
申请号: | 202010095784.6 | 申请日: | 2020-02-17 |
公开(公告)号: | CN111275129A | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 王俊;高鹏;谢国彤;杨苏辉 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京汇思诚业知识产权代理有限公司 11444 | 代理人: | 冯晓平 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 数据 增广 策略 选取 方法 系统 | ||
本发明实施例提供了一种图像数据的增广策略选取方法及系统,本发明涉及人工智能技术领域,方法包括:从增广策略集合中选取多个待定策略子集对预设的样本训练集进行样本增广,得到多个增广后的样本训练集;利用每个增广后的样本训练集训练初始化的分类模型,得到多个训练后的分类模型;将预设的样本验证集输入每个训练后的分类模型,得到训练好的分类模型对应的分类准确度;利用贝叶斯优化算法基于每个训练好的分类模型对应的分类准确度,从多个待定策略子集中确定最优策略子集。本发明实施例提供的技术方案能够解决难以确定哪种增广策略对当前类型的图像样本最有效的问题。
【技术领域】
本发明涉及基架运维技术领域,尤其涉及一种图像数据的增广策略选取方法及系统。
【背景技术】
深度学习在计算机视觉领域的成功一定程度归功于拥有大量带标记的训练数据,因为模型的性能通常会随着训练数据质量、多样性和数量的增加而相应提高。然而,要收集足够多的高质量数据来训练模型以使其具有良好的性能,往往非常困难和成本昂贵。
目前常用一些数据增广策略去增加数据量,用以训练计算机视觉模型,如平移、旋转和翻转等通过随机“扩充”来增加训练样本的数量和多样性。
然而,目前现有的增广策略各式各样,在面对不同的数据集的时候表现不一,难以确定哪种增广策略对当前类型的图像数据集最有效。
【发明内容】
有鉴于此,本发明实施例提供了一种图像数据的增广策略选取方法及装置,用以解决现有技术中难以确定哪种增广策略对当前类型的图像数据集最有效的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种图像数据的增广策略选取方法,所述方法包括:从增广策略集合中选取多个待定策略子集对预设的样本训练集进行样本增广,得到多个增广后的样本训练集,其中,每个所述待定策略子集由所述增广策略集合中至少一个增广策略组成;利用每个所述增广后的样本训练集训练初始化的分类模型,得到多个训练后的分类模型;将预设的样本验证集输入每个所述训练后的分类模型,得到训练好的所述分类模型对应的分类准确度;利用贝叶斯优化算法基于每个所述训练好的分类模型对应的分类准确度,从多个待定策略子集中确定最优策略子集。
可选地,所述利用贝叶斯优化算法基于每个所述训练好的分类模型对应的分类准确度,从多个待定策略子集中确定最优策略子集的步骤,包括:基于多个样本点构建高斯过程的回归模型,其中,每个样本点包括所述训练好的分类模型的分类准确度及训练所述分类模型所采用的待定策略子集;根据所述回归模型确定贝叶斯优化算法的获取函数;通过对所述获取函数的最大优化,从多个所述待定策略子集中确定最优策略子集,其中,利用所述最优策略子集增广后的样本训练集训练得到的分类模型的分类准确度最高。
可选地,所述将预设的样本验证集输入每个所述训练后的分类模型,得到训练好的所述分类模型对应的分类准确度,包括:
将预设的样本验证集输入每个所述训练后的分类模型;获取所述分类模型输出的训练精度及验证精度;根据所述训练精度和所述验证精度判断所述分类模型是否拟合良好;将拟合良好的所述分类模型确定为训练好的分类模型,并将所述训练好的分类模型的验证精度作为所述分类模型的分类准确度。
可选地,所述利用每个所述增广后的样本训练集训练初始化的分类模型,得到多个训练后的分类模型,包括:利用卷积神经网络提取输入分类模型的所述增广后的样本训练集中的每个样本的特征图;根据所述特征图,对所述增广后的样本训练集中的对应一个样本进行分类预测,得到分类结果;获取所述分类结果集合与所述样本训练集中的所有样本的标签集合的均方误差的损失函数;通过反向传播对所述卷积神经网络进行优化,以使得所述损失函数的值收敛,得到优化训练后的所述分类模型。
可选地,在所述将预设的样本验证集输入每个所述训练后的分类模型,得到训练好的所述分类模型对应的分类准确度之前,所述方法还包括:从所述预设的样本验证集随机抽取多个验证子集;将所述多个验证子集分别输入每个所述训练后的分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010095784.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置