[发明专利]样本数量的确定方法、装置、电子设备及存储介质在审
申请号: | 202010144448.6 | 申请日: | 2020-03-04 |
公开(公告)号: | CN111428858A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 苏英菲 | 申请(专利权)人: | 东软睿驰汽车技术(沈阳)有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 康莹 |
地址: | 110172 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 数量 确定 方法 装置 电子设备 存储 介质 | ||
本发明公开了一种样本数量的确定方法、装置、电子设备及存储介质,所述方法包括:获取用于训练深度学习模型的多幅样本图像信息;从所述多幅样本图像信息中获取多个不同设定数量的样本图像信息,训练出多个深度学习模型;获取每个所述深度学习模型的评价结果;基于所述评价结果,从所述多个不同设定数量中确定使所述深度学习模型稳定的最小样本数量。本发明可以实现基于深度学习模型的训练准确的确定使所述深度学习模型稳定的最小样本数量,有利于模型训练成本的控制,进而可以实现后续合理的安排为样本图像打标签的员工的工作量。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种样本数量的确定方法、装置、电子设备及存储介质。
背景技术
深度学习模型训练的整体框架包括:获取样本图像,然后对样本图像进行预处理,然后将预处理后的图像输入已有模型(如,yolo模型等)中进行训练,以得到稳定的模型。
相关技术中通常是基于经验确定用于训练深度学习模型的样本图像信息数量,不利于模型训练成本的控制,也无法实现合理安排为样本图像打标签的员工的工作量。
发明内容
有鉴于此,本发明提出一种样本数量的确定方法、装置、电子设备及存储介质以解决上述技术问题。
为了达到上述目的,本发明所采用的技术方案为:
根据本发明实施例的第一方面,提出了一种样本数量的确定方法,包括:
获取用于训练深度学习模型的多幅样本图像信息;
从所述多幅样本图像信息中获取多个不同设定数量的样本图像信息,训练出多个深度学习模型;
获取每个所述深度学习模型的评价结果;
基于所述评价结果,从所述多个不同设定数量中确定使所述深度学习模型稳定的最小样本数量。
在一实施例中,所述从所述多幅样本图像信息中获取多个不同设定数量的样本图像信息,训练出多个深度学习模型,包括:
从所述多幅样本图像信息中每次获取设定数量的样本图像信息,对当前得到的深度学习模型进行训练,得到每次训练后的深度学习模型。
在一实施例中,所述获取每个所述深度学习模型的评价结果,包括:
将测试图像信息输入每个所述深度学习模型,得到各个所述深度学习模型对所述测试图像信息中目标物体的预测结果;
基于所述预测结果对每个所述深度学习模型进行评价,得到每个所述深度学习模型的评价结果。
在一实施例中,所述基于所述评价结果,从所述多个不同设定数量中确定使所述深度学习模型稳定的最小样本数量,包括:
绘制各个深度学习模型的样本图像信息数量与评价结果的对应关系曲线;
基于所述曲线确定使所述深度学习模型稳定的最小样本数量。
在一实施例中,所述基于所述曲线确定使所述深度学习模型稳定的最小样本数量,包括:
基于所述曲线确定使所述深度学习模型稳定的各个样本图像信息数量;
基于所述各个样本图像信息数量中最小的样本图像信息数量,确定使所述深度学习模型稳定的最小样本数量。
根据本发明实施例的第二方面,提出了一种样本数量的确定装置,包括:
样本图像获取模块,用于获取用于训练深度学习模型的多幅样本图像信息;
学习模型训练模块,用于从所述多幅样本图像信息中获取多个不同设定数量的样本图像信息,训练出多个深度学习模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软睿驰汽车技术(沈阳)有限公司,未经东软睿驰汽车技术(沈阳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010144448.6/2.html,转载请声明来源钻瓜专利网。